正規表現
本記事は Sansan Advent Calendar 2022 - Adventar の初日の記事です。 正規表現は文字列マッチングにおいて、とても便利な機能です。 基本的に各プログラミング言語でライブラリとして実装されており、利用可能です。 そんな正規表現ですが、例えば貪欲な探…
perlだとUnicodeプロパティで\p{Hiragana}とするところです。 しかし、PythonはUnicodeプロパティをサポートしていない?ようですので、正規表現で獲得します。前提ひらがなの獲得カタカナの獲得Unicodeの確認前提Unicodeが対象です。ひらがなの獲得reモジュ…
いちいちエディタを開いてスクリプトを書くのは面倒だけど、perlの正規表現を使いたいです。 サクッと試すときはシェルコマンドとしてのワンライナーで perl -pe 'BEGIN{use encoding "utf8";}' s/(\d) /\1/g; もちろん、正規表現以外にもperlの機能が使えま…