かんちゃんの備忘録

プログラミングや言語処理、ゲームなど知的好奇心のための備忘録(個人の感想)です。

ErgoDoxEZを購入した

HHKB Pro 2 type-Sの日本語配列から、左右分離型キーボードであるErgoDoxEZに移行しました。

目的だった猫背の解消は、徐々に軽減されつつあるように思います。

きっかけから購入までを紹介します。

猫背解消がきっかけ

徹底的な猫背解消に取り組むためです。 現在猫背対策として、スタンディングデスクにしてディスプレイの高さに気を配ったり、ラットプルダウンやデッドリフトを始めとした筋トレに取り組んだりしています。

そんな中でHHKBの長所であるスリムなキーボードが、体格に合っていないことに気づきました。 キー入力をしていると、どうしても肩が前に出てしまいます。 左右分離型なら、肩を内転させずに作業できると考えました。

周りにErgoDoxEZユーザがいた

左右分離型キーボードユーザが周りにたまたま居たため、入力させてもらいました。 ErgoDoxEZとBaroccoを体験しました。

直感ですが、徹底的に対策するならErgoDoxEZがパームレストがあり、傾斜も変更可能なためいいと考えました。

購入してから届くまで三週間

ErgoDoxEZの公式サイトから注文しました。

無刻印の黒色で、ティルトキットとパームレストを付けました。 無刻印にした理由は、キー配置を変更した際に入れ換えなくていいことと、入れ換えたとしてもキートップの傾斜が適切なものではなくなるためです。

注文すると、宛先や注文内容が記載されたメールが届きます。 総計325USDでした。

1x Tilt/Tent Kit - Black for $25.00 each
1x The Wing: Custom ErgoDox EZ Wrist Rest - Black for $30.00 each
1x ErgoDox EZ Original Standalone - Blank / Black / Cherry MX Silent Red for $240.00 each
Subtotal : $295.00 USD

Shipping : $30.00 USD

Total : $325.00 USD

メールに記載のあった通り、約三週間後に発送されました。 配送状況などは、メール内のリンクからステータスを確認できます。

発送後にDHLのページから時間指定ができるため、都合のいい時間を希望します。

そこから待つこと約二日、指定時刻に佐川急便さんが来ました。 手数料を払って受けとりました(関税なのか何の手数料かは詳細はわからなかったが、1000円程度だったと思います)。

開封してセットアップすればErgoDoxEZライフが始まる

厚み約4cmくらいのわりと大きな箱を開封し、PCに接続すればErgoDoxEZライフが始まります。

私はキー設定でなんだかんだ数時間溶かしました(Emacsキーバインドで小指が疲れるため、どうやって親指にマッピングさせるか考えていると時間が溶けた)

キー設定やWindowsで利用するときのIME切り替えについては、別記事で書こうと思います。

Pythonのrequestsモジュールでの文字コード対策

【Webスクレイピング Advent Calendar 2017 4日目の記事です。】

Pythonrequestsモジュールは、 「Requestsは、人が使いやすいように設計されていて、Pythonで書かれている Apache2 Licensed ベースのHTTPライブラリです。」公式サイト1文目に記述されているほど、扱いやすいHTTPライブラリです。

そんなrequestsモジュールですが、日本語HTMLを対象に取得する際に文字化けを起こすことがしばしばあります。

その対策や原因について備忘録としてまとめます。

続きを読む

hugでAPIやCLIを作る

【Sansan Advent Calendar 2017 1日目の記事です。】

Pythonで、WebAPIやコマンドラインツールを作ったりするときに、ボトルネックになりがちなのが、ルーティングや引数の管理です。 hugは、ここらへんをよしなにやってくれるPythonモジュールです。

hugを使った、WebAPIやコマンドラインツールの作成について備忘録として記します。

続きを読む

ICDAR2017に参加した

f:id:kanjirz50:20171119214450j:plain

最近 会社の技術ブログにうつつを抜かし 、個人ブログに投稿できていなかったので、久しぶりの投稿となります。 (個人ブログ、少しはがんばろう)

会社スポンサーブース対応および聴講を目的に、京都で開催されたICDAR2017に参加しました。

これまで言語処理系の学会にばかり参加しており、画像系は初めてだったためとても新鮮でした。 参加した所感を書き残しておきます。

ICDARとは?

International Conference on Document Analysis and Recognitionの略で、文書の構造解析やOCR関連会議となります。

いくつかセッションをピックアップすると、以下の領域について議論が行われていました。

  • 文字列を利用した画像認識
  • 文字領域認識
  • 文字認識
    • 手書き文字
    • 印字された文字
    • 街中の看板など

特にOCR関係は、アラビア系文字を対象にした研究が多かったです。 アラビア系文字は推定が難しく、文字種も多いため研究対象となっています。

研究対象として、古典文書が一つのジャンルになっているようでした。 文字の欠けや、そもそもの紙の破れ、透けなど、技術的難しさが混在するようです。

全体的には言語処理と同様に、Seq2Seqで解けるタスク設計をしたり、CNNやLSTMを使って分類問題に落とし込んだりする研究が、どっと行われていました。

雰囲気が良かったことが印象に残っている

ICDAR2017に参加して一番に思い浮かぶ感想は、会場の雰囲気が良かったことです。

特に印象に残っているのが、発表者が質問を受け付ける旨を発表ごとに強調していたことです。 これに反応してか、積極的な議論もよく見受けられました。

発表も全体的に、背景と問題意識がわかりやすく述べられており、私としては隣の分野でしたが、わかる部分が多かったです。 ソースコードGithubでの公開や、学会が主となり作成するデータセットなど分野全体での統一感を感じました。

また、チュートリアル講演のサーベイの充実ぶりにはびっくりしました。 文書解析・文字認識界隈の流れを知ることのできる非常に良い機会となりました。

f:id:kanjirz50:20171119214512j:plain

強烈なチュートリアル

"Word Spotting - From Bag-og-Features to Deep Learning"というチュートリアルでは、単語切り出しにおいてこれまでのFeatureを作って分類するというモデルから、特にCNNをはじめとするディープラーニングに置き換わっているということを丁寧に説明されていました。 それぞれの技術の説明もあり、非常に勉強になるスライドでした。 CNNは特徴抽出のフィルタのようなもので、パラメータ調整はヒューリスティックにも頼らざるを得ないなど、貴重な現場での話が頻出していました。

"GMPRDIA: Graph-based Methods in Pattern Recognition and Document Image Analysis"は、文字認識領域におけるグラフ理論についてのチュートリアルでした。 そもそものグラフ理論から始まり、文字認識での応用例が紹介されていました。

ミスタードーナッツが美味しかった学会

f:id:kanjirz50:20171119214537j:plain

ブースでの英語対応に苦戦しつつ、面白い発表を聴講できたいい学会参加でした。

ちょっとつかれた脳みそに補充するティーブレイクのミスタードーナツは、格別に美味しかったです。

ICDARは隔年開催なので、次回は何か原稿を出して発表したいなと思いました。

Hacker's GATE LT大会に参加した

ウィルゲートさん開催のLT大会に参加しました

株式会社ウィルゲートでご活躍されている先輩に誘われて、5月30日に開催されたLT大会に参加しました。

つい先日にオフィス移転されたようで、本当にきれいなオフィスでした。

本記事は、LT大会の備忘録・感想となります。

発表

お題は『新年度を迎えて』というものでした。

Hacker’s GATEという名が物語るように、エンジニアリングに関する話が主題だと思います。

しかしながら、先輩から何でも良いと言われ、新年度を迎えて一番困っていることをテーマにしました。

それは「通勤」です。

4月より東京に住んでいますが、これまでに電車を利用する生活をしたことがなかったため、満員電車にはびっくり仰天させられています。

憂鬱な通勤を楽しくする工夫」というタイトルで発表しました。

f:id:kanjirz50:20170601224831j:plain

写真は、アンサイクロペディアからの満員電車の引用を使いながら満員電車について説明しているところです。

ネタを混ぜながら、私が通勤で工夫していること(古めかしい曲を聴いたり、ヨガっぽい呼吸をしたり)をご紹介させていただきました。

1番に発表させていただいたこともあって、楽しんでいただけたかと思います。 (次回以降は、技術ネタにしますしスライドも公開します(_ _ ))

他の人の発表は、

  • 仕事と趣味が見事に交差している人の発表
  • 日本語が話せない女の子と仲良くなるために翻訳インターフェースを作った人
  • たとえ高熱が出てもGithubに草を生やすことを絶やさないスゴイ人

などなど非常に楽しく濃い発表でした。

懇親会

LT大会が白熱しすぎて、懇親会の時間が短縮されてしまいました(笑)

何人かのかたとお話でき、知り合いが増えて良かったです。

また次回のLT大会でお会いするのが楽しみです。

おわりに

先輩に誘っていただき二つ返事で参加しました。最高でした。

LTを始めとして積極的に発表しようと思いますので、いろいろとお誘いください。

最後になりましたが、お誘いいただいた先輩、お話いただいた方々、LT大会を運営された方々、どうもありがとうございました!

人工知能学会全国大会(第31回)に参加した

2017年度 人工知能学会全国大会(第31回)に24・25日に参加した。 企業ブースでの説明と少し聴講を行ったので、備忘録としてまとめておく。

聴講

以下のセッションを聴講した。 言語処理に関連する分野を狙った。


以下、メモと感じたことを1段落ずつ記述。 都合により2件聴講できなかった。

ニューラルネットワークによる顔文字の原形推定

顔文字の原形推定がニューラルネットワークによる手法で、従来法と同程度の性能を達成したというものだった。 文字単位の処理であるため、未知のシンボルに対して、処理可能というのが従来法との違い。

出力に制約を加えると、精度が上がりそうであった。

ユーザの感性を考慮した顔文字推薦システムの実装とコミュニケーション相手の印象の変化の検証

顔文字はコミュニケーションで重要かつ繊細なので、それの利用法を推薦するシステムを実装。

人によって使っている顔文字が、8割がた傾向が異なるというのが面白かった。

画像特徴量を用いた大型アスキーアートの分類手法の提案

アスキーアートを画像と見立てて、元画像との類似度判定などの処理を試みる。

アスキーアートとその元ネタを集める情熱に、みんな驚いていた。

楽曲に特徴的なコメントに基づく作業用BGMからのインデックス作成

作業用BGMの曲間の切れ目や題目をコメントから抽出するタスク。

コメントだけでも割となんとかなっているように見えた。 曲間の切れ目は音声処理で、この手法でタイトルを抽出してもいいのではと思った。 (曲を聴かせると、曲名が分かるツールは何らかの類似度計算をやっているのかな・・)

誤り理由を考慮したニューラル文法誤り訂正

訂正の傾向が誤りによって異なることに着目し、attentionを誤り理由に応じて対応するようなモデルを提案。 半教師有りで学習可能。

誤り理由を隠れた状態として、モデルで推定するのが面白いと感じた。

都道府県議会会議録を対象とした議題・議案表現の自動抽出に向けた検討

議案・議題表現を自動抽出するために、正規表現によるパターンマッチで抽出の検討。

ルールを増やし続けることで、性能が改善されていくのか、頭打ちなのか知りたかった。

係り受け構造と情報利得に着目した複数の小規模コーパスによるWebタウンミーティングにおける投稿の自動分類

Web上でのミーティングを読むためには、投稿を読んだ上で理解する必要があるがそれは大変である。 概要把握の支援として、投稿を6つのラベルに分類する。

例文を見る限り、係り受けよりも、動詞と助動詞に重点を置いた方が良いのではないかと感じた。

議論の背景・過程・結果を関連づける地方政治コーパスの構築の試み

社会言語学自然言語処理で利用可能な地方政治コーパスを構築する試み。

方言の差が見えているのは非常に面白いと感じた。 また、名寄せが難しいというのは同感だった。

企業展示

学生の頃は企業展示を見る側でしたが、今回は企業展示をした。

弊社の取り組みに関して、説明させていただいた。

他の企業展示を見学させていただき、取り組みや公開されているデータについてお話を伺った。

会場では、昔お世話になった先生や知り合いと話しができて良かった。

その他

AI若手の会 ランチサロン

若手研究者同士が交流する場ということで、AI若手の会が開催した会。

知り合いが増えて良かった。 あとは、論文や技術をどういった視点で捉えるかということも勉強になった。

Chainer x Azureクラウド 深層学習 交流会

Chainerの動向について、面白おかしい話を聞いた。 キレッキレのツッコミが印象に残っている。

ここでも、いろいろな方とお話でき知り合いが増えた。

おわりに

お話させていただいたかたがた、どうもありがとうございました。

企業ブース・聴講・その他交流会で色々と面白い話を聞けて良かったです。

また学会などに参加しようと思うので、その際はよろしくお願いします。