note.comの「検索フォームの仕様」について調べる
webサイト分析における次善の策は『検索フォーム』
webサイトのデータ分析において基本となるのは多くの場合『そのサイトの運営者が公式に公開しているAPI』です。
しかし、それが提供されていないwebサイトの場合には次善の策として、そのサイトが公開している『検索フォーム』を使うという方法があります。
検索フォームは多くのサイトに設置されており、そのURLの構造を読み解くことで、効率的に欲しいデータをピックアップすることが出来るようになります。
そこで今回はnote.comのデータ分析の準備段階として、note.comの検索フォームの仕様について調べてきたいと思います。
検索フォームの場所
note.comの検索フォームはトップページ右上の方に設置されています。
検索フォームのURL
検索ページの基本URLは以下の様になっています
https://note.com/search
クエリを含んだ検索URLの例
この検索ページURLに検索クエリを足していくことで、わざわざ検索フォームを操作しなくても直接検索結果ページを開けるようになります。
検索語「python」
検索タイプ「ノート記事」
並び替え「人気順」
表示数「100」
https://note.com/search?context=note&q=python&sort=popular&size=100
では次に検索クエリについて検証していきたいと思います
「context」 検索対象の指定の指定
検索対象の指定は「context」で指定します。
指定できるのは以下の4つ
note
magazine
user
hashtag
それぞれについて詳しくみていくと
「note」は「ノート記事のタイトルを含め記事全体」が対象
「magazine」は「マガジンのタイトルと紹介文」が対象
「user」は「ユーザー名と紹介文」が対象
「hashtag」は「部分一致するハッシュタグ」が対象
となっているようです。
なおここでのハッシュタグの検索は『ハッシュタグ自体の検索』となっており、『ハッシュタグでの検索』については別の検索URLとなっている様です。
ハッシュタグ自体の検索
例:ハッシュタグ「python」を検索するURL
https://note.com/search?context=hashtag&q=python&size=100
ハッシュタグでの検索
例:ハッシュタグ「#python」の検索URL
https://note.com/hashtag/python
「q」 検索キーワードの指定
検索キーワードは多くの検索フォームの場合と同じく「q」のクエリで指定するようです。
なお検索キーワードの指定は必須となっており、残念ながら”これを指定しなかったら全体が検索対象になる”という仕様にはなっていない様です。
「sort」 並び替え順の指定
検索対象が「context(記事)」の場合『sort』のクエリで並べ替え順を指定できます。
指定できるsortのクエリは以下の4つとなっています。
popular
hot
new
like
「popular」は人気順でありデフォルトではこれが適用されるみたいです
「hot」は急上昇順
「new」は新着順
「like」はスキの数が多い記事順となっている様です
なお「マガジン」や「ユーザー」では並び替え順は指定できません。
「size」 表示数
「size」のクエリでは最初に表示される「表示数」について指定できるみたいです。
note.comは下にスクロールすることでページが順次追加されていくページですが、ここを指定することで一度にページに表示される事ができるため、スクレイピングを行う際にはとても便利に使えそうなクエリとなっています。
「size」は「記事・マガジン・ユーザー・ハッシュタグ」のいずれを対象として検索でも指定可能な仕様となっている様です。
まとめ
note.comの検索フォームの仕様についてみていきました。
全貌が捉えがたいnote.comですが、検索クエリを上手く活用することでデータ分析を行うことは充分可能と言えそうです♪
メモ代わりに♡ボタンよろしくおねがいします~
よろしければサポートお願いします。サポート? サポート……、サポート!よろしくおねがいします!?