正規表現を使ったパターン抽出
正規表現を使うと曖昧な文字列の探索ができます。典型的な例はテキスト中からの郵便番号の抽出や電話番号の抽出です。「JavaScript 正規表現まとめ」にその具体例があるので見てください。
また、とても簡単な応用で、テキストから漢字熟語を抽出することができます。
function extractKanji() { const text = '交感神経の興奮を心臓に伝えるβ1受容体を遮断し、心臓の過剰な働きを抑えることにより、降圧作用、抗狭心症作用、抗不整脈作用、抗心不全作用を示します。通常、本態性高血圧症(軽症?中等症)、狭心症、心室性期外収縮および慢性心不全(虚血性心疾患または拡張型心筋症に基づく)、頻脈性心房細動の治療に用いられます。'; const re = /[一-龥]{1,}/g; while(result = re.exec(text)) { Logger.log(result); } }
上記プログラムはUnicodeの漢字(「一」から「龥」までの範囲の文字)の1文字以上からなるパターンを探索してログに出力するプログラムです(Google Apps Scriptを想定しています)。