最速HTMLパーサ君(シェアウェア版)

高速でHTMLソースを構文解析できる

  • ソフト名 :最速HTMLパーサ君(シェアウェア版)
  • バージョン :2014-04-18
  • ライセンス :シェアウェア:648円
  • OS :Windows
  • 開発 :シュン・アローザル

今すぐダウンロード

最速HTMLパーサ君(シェアウェア版)詳細

HTMLの構文解析を行うことができるソフトです。
独自アルゴリズムで作成したパーサによる高速な処理が特徴となっています。
ウェブページのテキスト抽出、ウェブコンテンツ解析等にご利用ください。

◇ 動作条件 ◇
Microsoft Windows 7で動きます。

◇ 機能・実行例 ◇
ひとつのHTMLソースファイルを構文解析し、
「タグ情報ファイル」と「テキスト情報ファイル」に分解します。
◆タグ情報ファイルの見方
a[43],class=_wi|href=/intl/ja/ads/?fg=1|
上記は例としてGoogleトップページの解析結果の「タグ情報ファイル」から一行抜き出したもの。
43回目に出現するaタグは、class、hrefの属性を持ち、属性値は=を挟んで右側の値だと読みます。
各属性情報はご覧のとおりパイプ「|」で区切ってあり、タグ名との境界にはカンマ「,」があります。
◆テキスト情報ファイルの見方
html[0]body[0]div[74]div[85]div[86]div[87]div[88]span[47]a[43],広告
上記は同じ例の「テキスト情報ファイル」から一行抜き出したもの。
先程の43番目のaタグというのは、すでに5つのdivと1つのspanに囲まれており、
リンク表示文字は「広告」であることが読み取れます。
カンマ左はあるテキストを囲っているタグのリスト、
カンマ右はそタグ群に囲まれたテキストの内容となっています。
◆ライセンス取得による機能の変化
GUIに加え、"htmlparser.exe" をコマンドラインから実行できるようになります。
コマンドプロンプトから、もしくはプログラム中でOSコマンドを呼び出すこと
(C言語のsystem関数、Perl言語の“およびsystem関数 等)でご利用いただけます。
これによって、ご自身のプログラム中で呼び出す等、柔軟な使い方が可能となります。
又、ディレクトリ指定によるファイルの一括変換や、
結果ファイルの種類ごとに作成場所を個別指定することが可能になります。
詳しくはREADME.txtをご覧ください。

◇ 有料版の価格・お買い求め方法 ◇
本シェアウェアでは、無料版と有料版を同梱し、有料版をお使いいただける場合には
ライセンスキーを取得していただく形式をとっております。
詳しくはREADME.txtをご覧ください。

Leave a Reply

メールアドレスが公開されることはありません。 が付いている欄は必須項目です