読者です 読者をやめる 読者になる 読者になる

かんちゃんの備忘録

プログラミングや言語処理、ガジェットなど個人の備忘録です。(メモ書き+α)

NaiveBayse、SVMによる文書分類を試す

NaiveBayesによる文書分類、SVMによる文書分類を試しました。NaiveBayse, SVMによる文書分類フィードフォワードニューラルネットワークで文書分類ソースコードNaiveBayse, SVMによる文書分類文書分類とは与えられた文書をあるカテゴリに分類することです。 …

機械翻訳尺度METEORについて

機械翻訳の自動評価尺度にはいろいろなものがあります。 代表的なBLEUを始め、RIBESやMETEORなどがあります。評価尺度のうちの1つであるMETEORについて文献を軽く読みました。 その内容について、簡単にまとめたものです。An Automatic Metric for MT Evalua…

辞書整備は大変だ

言語処理の単語解析器を支える解析用「辞書」の整備は大変です。 後輩とああだこうだと議論しています。そもそも「辞書」とは例えばどんな記述か。辞書整備の難しさ完璧な辞書はないよ想定外のことが起きまくるでは、どうしましょうそもそも「辞書」とはここ…