KernelPCA

Description

This project implements the Kernel PCA technique for novelty detection as explored in the paper by Heiko Hoffmann [1]. The technique extends the traditional PCA to handle non-linear data distributions and is particularly good at identifying novel patterns in datasets where novel examples are rare compared to normal examples. This repository contains the code implementation and dataset samples for replicating the study's findings on synthetic and real-world datasets, including handwritten digits and breast-cancer cytology.

Key Features

Kernel PCA Implementation: Core implementation of the Kernel PCA algorithm.
Novelty Detection: Utilization of Kernel PCA for detecting novel instances effectively in datasets.
Datasets Included: Examples using synthetic distributions and real-world datasets for hands-on experimentation.
Performance Evaluation: Tools and scripts to assess the performance of the novelty detection using ROC analysis.

How It Works

The implementation maps training data into an infinite-dimensional feature space, where the principal components of the data distribution are extracted. Novelty is measured by the squared distance to the principal subspace in this feature space. This approach has demonstrated competitive performance in the studied applications.

References

[1] Heiko Hoffmann. “Kernel PCA for novelty detection”. In: Pattern Recognition 40.3 (2007), pp. 863–874: https://www.sciencedirect.com/science/article/pii/S0031320306003414

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
__pycache__		__pycache__
test sets		test sets
KPCAonMNist.ipynb		KPCAonMNist.ipynb
Kpca-on-Cancer dataset.ipynb		Kpca-on-Cancer dataset.ipynb
Kpca-on-Cancer dataset_NeededFigures.ipynb		Kpca-on-Cancer dataset_NeededFigures.ipynb
Kpca-on-Cancer dataset_NeededFigures2.ipynb		Kpca-on-Cancer dataset_NeededFigures2.ipynb
Kpca-on-Cancer dataset_Num_q Comparison.ipynb		Kpca-on-Cancer dataset_Num_q Comparison.ipynb
Kpca-on-Cancer dataset_Num_q Comparison2.ipynb		Kpca-on-Cancer dataset_Num_q Comparison2.ipynb
Kpca-on-Circle dataset.ipynb		Kpca-on-Circle dataset.ipynb
Kpca-on-Digit0 dataset.ipynb		Kpca-on-Digit0 dataset.ipynb
Kpca-on-Digit0 dataset_NeededFigures2.ipynb		Kpca-on-Digit0 dataset_NeededFigures2.ipynb
Kpca-on-Digit0 dataset_Num_q Comparison.ipynb		Kpca-on-Digit0 dataset_Num_q Comparison.ipynb
Kpca-on-Roll dataset.ipynb		Kpca-on-Roll dataset.ipynb
Kpca-on-ring-line-square data.ipynb		Kpca-on-ring-line-square data.ipynb
Kpca-on-sine-noise data.ipynb		Kpca-on-sine-noise data.ipynb
Kpca-on-spiral data.ipynb		Kpca-on-spiral data.ipynb
Kpca-on-square data.ipynb		Kpca-on-square data.ipynb
Kpca-on-square data_Fig7.ipynb		Kpca-on-square data_Fig7.ipynb
Kpca-on-square-noise data.ipynb		Kpca-on-square-noise data.ipynb
Kpca.py		Kpca.py
README.md		README.md
Test.py		Test.py
pca.py		pca.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

KernelPCA

Description

Key Features

How It Works

References

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

tsyasenpoor/KernelPCA

Folders and files

Latest commit

History

Repository files navigation

KernelPCA

Description

Key Features

How It Works

References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages