【拡張】HTML終了タグがないサイトに対応!台本作成自動化ツール向け追加機能
本記事へのアクセスありがとうございます。
ITエンジニアとして働いているheroと申します。詳しい活動内容や経歴に関しては、以下をご覧ください。
早速ですが、この記事を読んでくださっている「あなた」は、「台本自動化作成ツールを用いて反応集の動画投稿をされている方、もしくは、今後、投稿されようとしている方」ではないでしょうか?
その際に、以下の悩みや疑問を抱いたことはないでしょうか?
こういった悩みを解消するために、筆者が作成した「台本自動化作成ツール向けHTML終了タグ異常対策ツール」を本記事でご紹介します。
本Noteは、下記Note「反応集動画の台本を5chスレやまとめから自動作成」の続編です。本Noteでご紹介するツールは、下記Noteでご紹介したツールの1つの機能として提供します。そのため、本Noteのみ購入されてしまうと、本記事でご紹介するHTML終了タグ異常対策ツールを実行できませんので、ご了承ください。
HTML終了タグがないことで反応集向け台本作成が成功しないとは?
まずは、以下の順番で「HTML終了タグがないとは何か?」に関して解説します。
そもそも反応集とは?
台本とは:2ch/5chスレやまとめから投稿を取得し保存したもの
HTML終了タグがないとは?
そもそも反応集とは?【動画の種類のこと】
反応集とは、以下の動画のように、特定テーマに対する様々な意見や感想を紹介した動画のことを指します。
詳細な定義や作成メリットに関して、さらに詳しく知りたい方は、以下の記事をご覧ください。
台本とは:2ch/5chスレやまとめから投稿を取得し保存したもの
反応集の動画作成をするにあたり、特定テーマに対する様々な意見や感想を収集し、それらを動画内で、音声や字幕として紹介する必要があります。
反応集における台本とは、5chスレッド・まとめサイト・X(Twitter)などの様々なサイトから特定テーマに対する意見や感想を取得し、ファイルに保存したものです。
詳細な定義や自動作成する方法に関して知りたい方は、以下の記事をご覧ください。
HTML終了タグがないとは?【閉じタグが論理構造を守った場所にないこと】
台本自動化作成ツールを使っている際に、「抽出対象となる属性」を調べたことがあるかもしれません。
その際に、下図のように2ちゃんねるのように特定タグの終了タグが見当たらなかったことはなかったでしょうか?
上図のようなサイトにおいて、本記事で言及する「HTML終了タグがない」という事象が発生しています。
ちなみに終了タグ(別名:閉じタグ)の例として、<div>の後には</div>が必要です。また、一部のタグは終了タグを省略でき、<br>や<img />のようにスラッシュで閉じる自己終了タグもあります。
このような「HTML終了タグがない」事象は、サイト側の突然の仕様変更などにより発生することもあります。それに伴い台本自動化作成ツールでうまく投稿を抽出できなくなります。
こういった突然の仕様変更に伴う台本作成の失敗を解消するために、筆者が作成した「反応集向け台本のHTML終了タグ異常対策ツール」を本記事でご紹介します。
本Noteは、下記Note「反応集動画の台本を5chスレやまとめから自動作成」の続編です。本Noteでご紹介する「反応集向け台本のHTML終了タグ異常対策ツール」は、下記Noteでご紹介したツールの1つの機能として提供します。そのため、本Noteのみ購入されてしまうと、本記事でご紹介する「反応集向け台本のHTML終了タグ異常対策ツール」を実行できませんので、ご了承ください。
本記事で紹介する「反応集向け台本のHTML終了タグ異常対策ツール」について
本記事では、筆者自身が開発し、普段から使っている「反応集向け台本のHTML終了タグ異常対策ツール」を以下の順番で解説します。
できること(機能一覧)
できないこと(非機能一覧)
動作環境
注意事項
できること(機能一覧)
今回ご紹介するツールでは、以下のことができます。
機能:終了タグが論理構造を守った場所にないサイトから台本ファイルの作成
ご紹介ツールの実際の動作に関しては、以下の動画をご覧ください。
また、ご紹介ツールで作成された台本の中身を知りたい方は、以下から無料でダウンロードできます。
以下からダウンロードできる台本は、2ちゃんねる「赤身魚←美味い 青魚←まあイケる 白身魚←こいつ」から投稿を抽出し、ファイル保存したものとなります。
ちなみに、ご紹介ツールでは、以下のサイトに掲載された投稿を抽出できることを確認しています。
上記サイトと似ているサイト形式であれば、ご紹介ツールで対応できる可能性が高いです。
以下のいずれかでご質問していただければツールの動作確認をしますので、お気軽によろしくお願いします。
できないこと(非機能一覧)
ご紹介ツールでは、以下のことはできません。ただし、コメントで多数の要望がありましたら追加開発させていただきます。
投稿の文字装飾(例:太字など)を維持した抽出
動作環境
ご紹介ツールは、Windows上でのみ動作します。また、動作させるために追加で必要となるソフトウェアやアプリケーションなどは特にありません。
MacOSで使いたい方は、本Note記事のコメントにその旨を記載していただければ幸いです。要望多数の場合は、対応させていただきます。
注意事項
ご紹介ツールを使う上での注意事項を、以下に記載します。
動作異常やトラブルに関してはベストエフォートで対応します。また、トラブルなどを解決できない場合もありますのでご注意ください。本記事へのコメントまたはNote経由でのお問い合わせをお願いします。ただし、導入されているセキュリティソフトが原因と考えられる動作異常やトラブルに関してはお答えいたしかねます。
「ご紹介ツールの対応表」で記載されているサイトでも、サイトの急な仕様変更などによって、台本作成できない場合もあります。
図「ご紹介ツールの対応表」に掲載されたサイト以外にもHTML終了タグがないサイトがあり、そこから台本作成したいケースがあるかと思います。その際には、ツールに入力するべき属性を調べる必要があります。調べ方に関しては、こちらの記事に掲載された図「Chromeを使用した抽出対象となる属性の調べ方」を参考にしてください。調査が難しい場合、有料となりますが、こちらで情報を調査し、その結果をまとめた有料Note(500円程度)を提供いたします。
このツールの使用によって生じる損害については、責任を負いかねます。使用に際しては、自己責任でお願いいたします。
HTML終了タグ異常対策ツールの使い方
今回開発した「HTML終了タグ異常対策ツールの使い方」について、以下の項目で順番に解説します。
HTML終了タグ異常対策機能を使うための操作手順
動作確認したサイトの一覧
HTML終了タグ異常対策機能を使うための操作手順
台本自動化作成ツールと同じ操作手順となります。以下の記事の「台本作成の方法」箇所をご覧ください。
動作確認したサイトの一覧
動作確認したサイト一覧を以下にまとめます。一覧内に該当するサイトがありましたら、「抽出対象となる属性」に記載された値をツールの入力欄に設定することで、コメント抽出を実現できます。
サイト名:抽出したいURL欄の入力例:抽出対象となる属性欄の入力例
2ちゃんねる:https://tomcat.2ch.sc/test/read.cgi/livegalileo/1716926341/:dd_WS_1
まちBBS:https://machi.to/bbs/read.cgi/kanto/1697762013/:dd_WS_1
抽出したいURL欄の入力例に関して以下で補足します。
抽出対象となる属性欄の入力例に関して以下で補足します。
導入準備
本記事は有料です。
また、HTML終了タグ異常対策ツールは、台本作成自動化ツールの拡張機能(プラグイン)です。そのため、台本作成自動化ツールの導入および正常動作が前提となります。
台本作成自動化ツールの導入方法などに関しては、以下の記事の「導入準備」をご覧ください。
>> 台本作成自動化ツールの動作確認用のEXEファイルを用いた動作確認手順
上記の「動作確認用のEXEファイル」が正常に動作した場合、本記事で提供する「HTML終了タグ異常対策ツール」もお使いのパソコンで正常動作いたします。
以下を満たす場合、ぜひ、本ツール(本Note)のご購入をご検討ください。損はないはずです!
本記事の値段は980円とさせてください。ランチ定食を1回だけ我慢すれば買える価格となっております。
本Noteのお値段は決して安くありません。「反応集の動画を作成し、Youtubeなどで稼ぎたい」や「クラウドワークスなどで掲載されている反応集作成案件で稼ぎたい」という方以外は、今すぐ本Noteを閉じることをオススメします。
最後に、本記事でご紹介したツールの実際の動作を、以下の動画に掲載します。
上記のように、2ちゃんねるなどのHTML構造が少しおかしいサイトからも台本をサクッっと作成したい方は、本記事の購入をご検討をオススメいたします。
ちなみに、本ツールは、台本作成自動化ツールの拡張機能として提供されています。台本作成自動化ツールには、「あなた」の作業をさらに効率化できるその他の拡張機能も用意しています。時間を節約し、効率的に作業を進めたい方は、ぜひ以下のリンクをチェックしてください。
ここから先は
¥ 980
この記事が気に入ったらサポートをしてみませんか?