かんちゃんの備忘録

プログラミングや言語処理、ゲームなど知的好奇心のための備忘録(個人の感想)です。

正規表現

正規表現マッチングの処理時間にも気をつける

本記事は Sansan Advent Calendar 2022 - Adventar の初日の記事です。 正規表現は文字列マッチングにおいて、とても便利な機能です。 基本的に各プログラミング言語でライブラリとして実装されており、利用可能です。 そんな正規表現ですが、例えば貪欲な探…

Pythonの正規表現でカタカナやひらがなを引っかける

perlだとUnicodeプロパティで\p{Hiragana}とするところです。 しかし、PythonはUnicodeプロパティをサポートしていない?ようですので、正規表現で獲得します。前提ひらがなの獲得カタカナの獲得Unicodeの確認前提Unicodeが対象です。ひらがなの獲得reモジュ…

perlで正規表現ワンライナー

いちいちエディタを開いてスクリプトを書くのは面倒だけど、perlの正規表現を使いたいです。 サクッと試すときはシェルコマンドとしてのワンライナーで perl -pe 'BEGIN{use encoding "utf8";}' s/(\d) /\1/g; もちろん、正規表現以外にもperlの機能が使えま…