Pattern Recognition & Machine Learning
確率的トピックモデルに基づく文書認識&画像認識
我々人間は文書などを読むと、それがどのような分野に関するものであるのか、また その中に含まれている話題などを理解することができますが、これらは文書の中に 明示的に書かれている訳ではないのが通常です。これら隠れたトピックを人間が 教えることなく、データから学習し、文書の内容や意味を理解するために、確率的トピックモデル (probabilistic topic model)の研究が行われています。
確率的トピックモデルは通常単語の頻度分布に基づいて構築されますが、文書以外であっても 「単語」に相当する特徴量を用いることにより、例えば画像情報、音楽情報など広範な対象に適用することが可能 であると考えられます。 本研究室では、確率的トピックモデルを用いて、文書に含まれる内容やその時間的経過による 変化を理解するための研究や、確率的トピックモデルを画像に適用し、画像内容理解を行う ための研究を実施しています。
【発表論文】
山口拓真, 丸山稔, "確率的トピックモデルによる文書画像の領域分割",
電子情報通信学会論文誌D, Vol.J92-D, No.6, pp.876-887 (2009).
T.Yamaguchi and M.Maruyama, "Feature extraction for document image segmentation by pLSA model",
Proc. 8th IAPR International Workshop on Document Analysis Systems (DAS2008), pp. 53 -- 60 (2008).
Best paper award honorable mention
画像類似度検索のための画像特徴表現の学習
与えられた画像に対して、大量の画像データ集合の中から類似画像を検索する際には、検索精度と検索速度が問題になります。
高速かつ高精度の画像検索を実現するためには、適切な画像特徴を選択すると共に、類似度計算を精度よく高速に行うための
方式を確立する必要があります。本研究では、特徴量の学習、識別関数の学習など、学習に基づいてこれらの課題を解決するための
手法を検討しています。
【発表論文】
宮下徹也, 丸山稔, 宮尾秀俊 ,"重みベクトルの学習に基づく類似画像検索の性能",
電子情報通信学会信越支部大会講演論文集, 5D-3 (2013).