類字抽出ツール

意味が同一で、表記だけ(全/半角、ひらがな/カタカナ、大/小文字等)が異なっている文字列を抽出

  • ソフト名 :類字抽出ツール
  • バージョン :1.00A
  • ライセンス :フリーソフト
  • OS :Windows
  • 開発 :HRC

今すぐダウンロード

類字抽出ツール詳細

類字とは、同じ意味の文字で全角/半角あるいはひらがな/カタカ
ナ、大文字/小文字による表示が異なる文字のことで、以下の事例
があります。
・事例
NO-1. シャーベット
NO-2. シャ-ベット ※NO-1の長音符が半角ハイフン
NO-3. シャーベット
NO-4. しゃーべっと
NO-5. しやーべつト
NO-6. シャーヘ゛ット ※"ベ"の濁点が分離して 2文字に分裂

例えば、表計算ソフトでデータベースを作成している場合、人間は
上記の事例を全て同じ意味の文字として認識できますが、集計等の
作業をシステム処理する場合は問題(※)となる可能性があります。
※問題例
同じ意味のデータが、別個のデータとしてシステム処理される
上記事例の場合、表計算ソフトのカウント関数等で"シャーベット"
の個数を数えると意味的な結果=6 に対してカウント結果=1 となる

この問題は、複数の類字を一つの文言に統一すれば解決します。
そのためには、まず類字の有無を確認することが必要です。
類字の有無は、表計算ソフトのフィルタ機能でも確認できますが、
データが大量の場合、その確認作業は大きな手間がかかります。

本ソフトは、大量のデータから類字のみを抽出して確認する作業を
ごく簡単な操作で自動処理して手助けします。
また、重複が許されないデータ(例.シリアル番号等)を簡単に確認
するツールとしてもご利用いただけます。

Leave a Reply

メールアドレスが公開されることはありません。 が付いている欄は必須項目です