[三流君] [VBAで楽しく] [VBA IE 操作]
−−> No.119 IEを使用して、Web上の表をExcelへ

IEを使用して、Web上の表をExcelへ

概要:
TABLEのタグから階層的にTR,TDのタグを取り出し、
Web上の表データをExcelに転記しました。
タグはタグの集合体、そんな階層イメージがわかればOKです。

関連項目:Webページから表を取り込むサンプル。(別の切り口で)
↑ラフな設計から製造まで[VBA IE操作 表の取り込みサンプル]を見て下さい。
↑の実行サンプルは[↑の小細工した実行サンプル]
(IE_GET_TABLE_0316.zip です。解凍して動かして確認してください)

※メルマガ記事ではオブジェクトの参照設定をしていませんができれば、下記を参考に参照設定してください。
[Microsoft Internet Controls,Microsoft HTML Object Library を参照設定する](このほうが開発時、操作時に楽)
また、VistaとIE7の場合は、 [IE7 操作 Vistaで失敗]も参考にしてください。

リンク 分類: [Document(文章)からデータを取得] / [Form入力処理] / [Linkリンク情報] / [Image画像情報] / [Frameフレーム処理] サンプル: [IEを使ったVBAのサンプル] / [小さなVBAでIE操作のコード]

メルマガ発行内容

やっと、下記、メルマガで発行した内容です。何かの参考となれば幸いです。
過去のメルマガ[IE操作系の記事一覧]もヨロシクです。

<IEを使用して、Web上の表をExcelへ>

どうも、三流プログラマーのKen3です。 今回は、 IEを使用して、Web上の表をExcelに取り込む処理 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ そんな感じの処理を作成してみたいと思います。 http://www.ken3.org/p/7/office-026.lzh に今回のサンプル保存されてます。 あわせてみてください。

/* * 1. 今回のキッカケ */

メールで下記の質問をもらいました。 ----- >私は、IEのテーブル部分をマウスで範囲選択しコピー、そ >れをExcelに貼り付けています。これで、セルスタイル >のデータになります。 >次に、Excelデータをアクセステーブルに追加貼付け >しています。これら一連の手作業をVBAで自動的にやりた >いのですが、できれば、連続的に例えば同種で複数のページ >を自動的に取り込めたらと思うのですが。 ----- 要望は、Accessのテーブルへだけど、 今回は、途中のIE --> Excelへの落とし込みにチャレンジしてみます。

/* * 2.IE Elementオブジェクト(タグに対応した各要素)を探る */

IEのオブジェクトの要素を探ってみます。 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Sub ie_test_click()

    Dim objIE    As Object  'IEオブジェクト参照用
    Dim objTAG   As Object
    Dim y As Integer

    'インターネットエクスプローラーのオブジェクトを作る
    Set objIE = CreateObject("InternetExplorer.application")
    
    objIE.Visible = True '見えるようにする(お約束)

    '文字列で指定したURLに飛ぶ
    objIE.Navigate "http://www.ken3.org/cgi-bin/g/index.html"

    '表示終了まで待つ
     Do While objIE.Busy = True
         '何もしないループ(笑)
         DoEvents
     Loop

     '
     y = 2
     
     '.All のデータをループする
     For Each objTAG In objIE.document.all
        Cells(y, "A") = objTAG.tagName
        Cells(y, "B") = objTAG.innerHTML
        Cells(y, "C") = objTAG.innerTEXT
        Cells(y, "D") = objTAG.outerHTML
        Cells(y, "E") = objTAG.outerTEXT
        y = y + 1
     Next

End Sub
ポイントは、 ~~~~~~~~~~~~ For Each objTAG In objIE.document.all で、.Allまわしてみました。 Cells(y, "A") = objTAG.tagName Cells(y, "B") = objTAG.innerHTML Cells(y, "C") = objTAG.innerTEXT Cells(y, "D") = objTAG.outerHTML Cells(y, "E") = objTAG.outerTEXT で、それぞれ、データをセットしてみました。 Elementオブジェクト(タグに対応した各要素) innerHTML 内部にあるタグ付き文字列 innerText 内部にある文字列のみ outerHTML 外部も含めたタグ付き文字列 outerText 外部も含めた文字列 tagName 対象となっているタグの名前 と、データが取れるので、確認してみてください。 HTMLは、基本のパターンを書くと、 <Font SIZE=+1><I>AAAA</I></Font> と、 タグの開始と終了に挟まれています(囲われてます) For Each objTAG In objIE.document.all で、各タグを取り出してます。 まぁ、 .tagNameがタグの名前なので、FONTとなっていて、 ^^^^^^^^ .innerHTMLは内部にあるタグ付き文字列なので、<I>AAAA</I> ^^^^^^^^^^ .outerHTMLが外部も含めたタグ付き文字列、なんて堅く書いてるけど、 ^^^^^^^^^^そのまんまの、 <Font SIZE=+1><I>AAAA</I></Font> と外側のタグも含めたHTMLの文字列なんですね。 あとは、innerText,outerText は、タグが抜かれたテキストです。 場面によって、使い分けてくださいね。

/* * 3.表のオブジェクト(TABLEタグ)を探る */

作りたいのは、Web上に表示されている表から、 データを取り出したい処理なので、そこら辺を探ってみます。 HTMLの表は、基本のパターンを書くと、 <TABLE> <TR> <TD>XXXXXX</TD> <TD>YYYYYY</TD> <TD>ZZZZZZ</TD> </TR> </TABLE> と、 <TABLE>テーブルのタグから始まり、 <TR>行の開始 <TD>列のデータ(<TH>と見出しをキチント書いている人もありです) の 3つの組み合わせと順番です。 IE Elementオブジェクト(タグに対応した各要素) で、 Elementオブジェクト(タグに対応した各要素) innerHTML 内部にあるタグ付き文字列 innerText 内部にある文字列のみ outerHTML 外部も含めたタグ付き文字列 outerText 外部も含めた文字列 tagName 対象となっているタグの名前 を探ってました。 下記のテストプログラムで、 http://www.ken3.org/cgi-bin/cnt/test.asp で表示される表を探ってみます。
Sub ie_test_click()

    Dim objIE    As Object  'IEオブジェクト参照用
    Dim objTAG   As Object
    Dim y As Integer

    'インターネットエクスプローラーのオブジェクトを作る
    Set objIE = CreateObject("InternetExplorer.application")
    
    objIE.Visible = True '見えるようにする(お約束)

    '文字列で指定したURLに飛ぶ
    objIE.Navigate "http://www.ken3.org/cgi-bin/cnt/test.asp"

    '表示終了まで待つ
     Do While objIE.Busy = True
         '何もしないループ(笑)
         DoEvents
     Loop
     
     'データを削除する
    Rows("3:1000").Select
    Selection.Delete Shift:=xlUp
     
     '3行目から書き込む
     y = 3
     
     '.body のデータをループする
     For Each objTAG In objIE.document.body.all
        Cells(y, "A") = objTAG.tagName
        Cells(y, "B") = objTAG.innerHTML
        Cells(y, "C") = objTAG.innerTEXT
        Cells(y, "D") = objTAG.outerHTML
        Cells(y, "E") = objTAG.outerTEXT
        y = y + 1
     Next

End Sub
タグ別にデータを取り出せるが、 これだと、テーブルは見つけられても、セットできない。 う〜ん、、どうしましょう・・・ objIE.document.body.allのアイテム内を探すと、 さらに下の<TABLE>のアイテムを探ると、 ITEM8なんですが、その下にもALLの階層があって、 さらにアイテムを探すと、テーブルの中身が取れます。 Item8は、.all 28個のアイテムを持っていて、 なんて感じで、テーブル内のデータを探れそうです。

/* * 4.階層を深くたどり、Excelへデータを取り込む */

TABLEのタグを見つけたら、 そのITEM内をさらに.Allで探し、テーブルをExcelの表にしてみたいと思います。
Sub ie_make_table_test()

    Dim objIE    As Object  'IEオブジェクト参照用
    Dim objTAG   As Object  'TAGのオブジェクトを代入
    Dim y As Integer
    Dim x As Integer
    Dim objTableItem As Object 'TABLE内のITEM検索用

    'インターネットエクスプローラーのオブジェクトを作る
    Set objIE = CreateObject("InternetExplorer.application")
    
    objIE.Visible = True '見えるようにする(お約束)

    '文字列で指定したURLに飛ぶ
    objIE.Navigate "http://www.ken3.org/cgi-bin/cnt/test.asp"

    '表示終了まで待つ
     Do While objIE.Busy = True
         '何もしないループ(笑)
         DoEvents
     Loop
     
     '.body のデータをループする
     For Each objTAG In objIE.document.body.all
        'テーブルのタグを探す
        If objTAG.tagName = "TABLE" Then
            '新規ブックを追加する
            Workbooks.Add
            'カウンタの初期化
            y = 0 '行カウンタ
            'テーブル内のITEMでループする
            For Each objTableItem In objTAG.all
                If objTableItem.tagName = "TR" Then
                    y = y + 1   '行カウンタを+1
                    x = 1 '列カウンタを1(左端にする)
                End If
                If objTableItem.tagName = "TD" Then
                    'テキストデータをセットする
                    Cells(y, x) = objTableItem.innerText
                    x = x + 1 '列カウンタを+1(次にする)
                End If
            Next
        End If
     Next

End Sub
なんか、ループが深いですが、 ポイントは、 ^^^^^^^^^^^^ For Each objTAG In objIE.document.body.all と、<BODY>内をループで回し、タグ(ITEM)を1つ1つ取り出します。 取り出したタグがTABLEか判断するには、 If objTAG.tagName = "TABLE" Then と、.tagNameで判断してます。 ※TABLEの要素を.document.body.allから見つけます。  見つけ方は、.tagNameとタグの名前がTABLEかで判断してます。 TABLEのITEM(要素、エレメント)を見つけたら、 今度は、そのTABLE内のITEMを1つ1つ取り出します。 For Each objTableItem In objTAG.all objTAG.allがポイントです。 ※objTAGがテーブルのオブジェクトです、  このオブジェクトは、階層構造になっており、  アイテムを複数持ってます。  そのアイテムを取り出すために、 For Each objTableItem In objTAG.all  と記述して、TABLEオブジェクトから要素(TRやTDなど)を取り出します 行の開始が<TR>なので、 If objTableItem.tagName = "TR" Then y = y + 1 '行カウンタを+1 x = 1 '列カウンタを1(左端にする) End If と、行を+1列を開始位置の1にセットします。 <TD>がデータなので、 If objTableItem.tagName = "TD" Then 'テキストデータをセットする Cells(y, x) = objTableItem.innerText x = x + 1 '列カウンタを+1(次にする) End If と普通にデータをセットしてます。

/* * 5.終わりの挨拶 */

今回は、 IEのオブジェクト、ITEMを探るのを兼ねて、 <TABLE>をExcelに取り込んでみました。 http://www.ken3.org/p/7/office-026.lzh に今回のサンプル保存されてます。 あわせてみてください。 最大のポイントは、 みつけた<TABLE>のアイテムからさらにITEMが検索可能だった点です。 まぁ、よくよく、考えてみれば、 <HTML> 〜 </ HTML>と、一番大きなタグ(笑) から、ITEM単位で行っているので、 大分類から中分類、小分類を探る、そんな感じでしたね。 なんか、出来たようなこと、完成したと書いてるけど、 結合セルの処理がまだなのと、右寄せ・中央・左寄せなどの処理、 バックカラーの処理がまだかなぁ。 あっ、あと、表なのに、罫線もつけてないしね・・・ 不思議なIEお嬢様、まだまだ攻略できそうにないよね。 えっ、Excel姫やAccessお姉さまも攻略して無いダロって? ※う〜ん、実力無くて、なかなか、攻略できなくて。。。。 何かの参考となれば幸いです。 Excel/Access大好き、三流プログラマーKen3でした。

ページフッター リンクや広告、質問送信など

三流解説を読んでいただき、どうもです。ここから下は、三流君宛のメッセージ送信や 三流君のホームページの紹介・案内です
目的の情報が見つかったか?少々心配しつつ、、、※質問や感想は、気軽に送ってくださいね。

[三流君 VBAでWebBrowser IEを操作する] / [三流君 VBAで楽しくプログラミング] / [AB型の変わり者 三流プログラマー Ken3 三流君Top]

大分類:[Document.Forms(入力処理)] / [Document.Links(リンク情報)] / [Document.Images(画像情報)] / [Document.Frames(フレーム処理)]
サンプル・例題:[過去のメルマガ記事一覧] / [少し大きなIE操作サンプル] / [小さなコードでIE操作の動作確認]

F1でヘルプを見たり、デバック時にDebug.Print使ったり、イミディエイト ウインドウで簡単な確認したり。
なれると当たり前に操作している方法が↓かなぁ。
[F1ヘルプ マクロ記録ほか]・・・基本のF1を押してヘルプを見る方法など
[実行時エラー、デバッグモード]・・・デバッグの流れを簡単に(ハマった時はツライけど)
[イミディエイト ウインドウ と Debug.Print]・・・プログラム作成時に便利なイミディエイト ウインドウ
[VBA ウォッチ式とSTOPを使ってみた]・・・STOPで止め、ウォッチ式でオブジェクトの中身を確認する方法など
[参照設定のお話]・・・設定すると便利な(設定しないと使えない)、参照設定のお話

項目別に↓にプログラマーの本音?それとも建て前?的な記事をまとめました。お探しのジャンルを選択してください。
[プログラムは心? spirit]・・・プログラマー 心・気質・魂
[学ぶ study]・・・学習、技術の取得
[仕様書 doc]・・・仕様書・設計書関係の話

項目別に↓に人気の記事をまとめてみました。お探しのジャンルを選択してください。
[VBAでIE ウェブブラウザーを操作]・・・VBAでIE,WebBrowserを操作する サンプルです
[MSアクセス から エクセル を呼ぶ Excel.Application]・・・AccessからExcelを操作したりデータの書き出しなどです
[アウトルック メールの操作 Outlook.Application]・・・VBAからOutlookを使い、メール関係を処理するサンプルです
↑上記3つみたいなCreateObjectで他のアプリケーションを操作するサンプルが人気です。

Excel関係:
[エクセル ユーザーフォームを操作する]・・・エクセルでユーザーフォームを作成して入力などを行ってます
[エクセルからアクセスを操作する]・・・ExcelからAccessのマクロを起動してみました、
[エクセル関係 関数、その他]・・・その他Excel関係です

Access関係:
[アクセス ユーザーフォーム/サブフォーム 操作]・・・アクセスでフォームを使ったサンプルです
[アクセス レポート操作]・・・レポートを操作してみました
[アクセス クエリーやその他関数]・・・あまりまとまってませんが、スポット的な単体関数の解説です

その他:VBAの共通関数やテキストファイルの操作など
[テキストファイルの操作(Open,Close,Print,Input)]・・・普通のテキストファイルを使ったサンプルです

Blog:[三流君の作業日記]/ [objIEを使用したサンプルコードを見る]/ 広告-[通販人気商品の足跡]

質問や要望など メッセージを送る(三流君に連絡する)

三流プログラマーのKen3 が 皆さんの質問にお答えします
と カッコつけて言っても、実力不足ですべての質問に回答することはできないのが現実なのですが、できる範囲で 三流的な逃げ手 や 解決方法 を探します(回答します)。

感想や質問・要望・苦情など 三流君へメッセージを送る。
時間的余裕のある要望・質問・苦情の場合は、下記のフォームからメッセージを送ることができます。

あなたのお名前(ニックネーム):さん
返信は?: 不用(HP更新を待つ) , E-mail→ アドレス:に返事をもらいたい



(感想や質問・要望 メッセージはHPで記事に載せることがあります。)

急ぎで連絡がほしい、そんな時は:[三流君連絡先]に連絡してください。



[トップページへ 戻る] / [VBA TOP] / [WebBrowser IEの操作 TOPへ]