【DMLA】画像検索のための半教師あり学習のHashing

本日の勉強会の内容の復習。


Semi-Supervised Hashing for Scalable Image Retrievalhttp://www.ee.columbia.edu/ln/dvmm/publications/10/SSH_CVPR2010.pdf
Jun Wang, Sanjiv Kumar, Shih-Fu Chang

・Hashを使って画像の近似を見て検索する手法が研究されている
・教師ありの機械学習で意味的な近似度を操作できる
・しかし、ラベル付けされたデータが小さかったりノイジーだとうまくいかない。学習時間も長い。
・この問題点を解くために、Semi-Supervised Hashingを提案する
SSHはSH(Spectral Hashing)の類似度の計算をかえている(?)

  • Locality Sensitive Hashing(LSH)について

・似ているものには似ているビット列を与える
Locality Sensitive Hashing - (setf yaruki nil) - nlpyutoriグループが分かりやすいと思う。

  • Spectral HAshing(SH)について

・NP困難な問題について主成分分析をすることで次元圧縮し、ベクトルの固有値問題に落とし込む
mamorukさんのページWEB+DB PRESS Vol.49 を読んで Spectral Hashing について考える - 武蔵野日記少し書いてある。

  • Restricted Boltzmann Machines(RBMs)について

・ボルツマンマシンは指数分布族の統計モデル
・隠れ変数について周辺化した分布の尤度を最大にする
参照:Deep Learning and Restricted Boltzmann Machinehttp://www.stat.phys.titech.ac.jp/~mohzeki/YSMSPIP/Abst/YSM-SPIPYasuda.pdf