見出し画像

文章型データベースを求めて③検索方法、出力方法

 「文章型データベースを求めて」の第3回目です。今回は記事の検索方法、出力方法についての話です。
 ここで説明する検索方法、出力方法(表示・印刷)を実現するには自作するしかありません。従いましてTxt_htmlの説明になることをあらかじめご了承ください。
 百聞は一見に如かず。サンプルのデータベースをお試しください。
 🔍で検索するか、日付指定してください。
 △で年月表、▽で本日、📅でカレンダーを表示します。
 → http://mgh03015.fc2web.com/wdiary/index.html#po1234jp&readme

html化したデータベースの画面構成


web検索のような検索をしたい(and検索)

web検索をするときに「A B C」というようにキーワードの間にスペースを入れて検索すると「A かつ B かつ C」が抽出されます。これを「and検索」といいます。
文章型データベースにはand検索は必須と考えます。その理由を説明します。
and検索を試してみてください。
 → http://mgh03015.fc2web.com/wdiary/index.html#po1234jp&readme

記事ごとのand検索は必須

見出しとその本文を「記事」とします。
キーワードひとつの検索では、多数の記事が抽出される可能性があります。
この場合、スクロールさせて確認する必要があります。
目的の記事を絞り込むために記事ごとのand検索が必要です。

一日単位のand検索も必要

「押し出しファイリング」理論に基づき、関連情報を同じ日に並べるようにしています。
例えば「Aに関する記事」「Bに関する記事」というように見出し付けをしています。
「Aに関する記事 Bに関する記事」が揃う日を検索するには「一日単位のand検索」が必要です。
この検索は、次に説明する「こうもり問題」にも有効です。

関連情報を並べるだけで「こうもり問題」解決

 こうもり問題とは、A にも B にも分類できる場合に、どちらに分類すればいいのかという問題です。
 「こうもり問題」は同じ日に並べて入力しておけばよく、分類する必要はありません。
 関連する情報が同じ日に「ひとまとまり」になっていることが重要です。

①ある日、獣チームと鳥チームがもめました。
②獣チームが優勢になるとこうもりは「私は哺乳類、つまり獣だ」といって獣チームにつきました。
③鳥チームが優勢になるとこうもりは「羽があるから私は鳥だ」といって鳥チームにつきました。
④ついにこうもりは獣・鳥どちらのチームからも絶縁され、洞窟にこもったとさ。

 このように関連する情報が並んでいれば、こうもりを獣か鳥か分類する必要はありません。「ひとまとまり」にした日付がわかれば、関連性を知ることができます。 「分類するな。ひたすら並べよ」「関連情報はひとまとまりにしておけ」です。

一日表示で関連情報を表示

「こうもり問題」の記事④を「ついにこうもりはどちらのチームからも絶縁され、洞窟にこもったとさ」としてみましょう。
「獣」「鳥」を消したのでこのキーワードでは抽出できなくなりました。
しかし、「獣」「鳥」の記事と並んでいますので、一日表示にすれば、①~④が表示されます。一連の状況(もめた経過)がわかります。

一日表示

記事を選択して表示できること

一日の記事の中には関係のない記事も含みます。関係のない記事を除外し、目的の記事のみ表示する機能が必要です。
「ひとまとまり」になった記事を抽出する機能です。
次は「鳥チーム」の記事を選択している例です。

☑を一括表示

見出しの章番号で階層抽出ができること

  • 章番号とは
    論文などで章立ての際に「1-2-3」というように番号をふるのが一般的です。それぞれ「章」「節」「項」を表します。
    章番号は、アウトラインプロセッサやWordの見出しの設定でふるのが一般的です。

  • 章番号をそのまま使い、階層下の記事を一括抽出できると便利です。
    例えば憲法第十章の条文すべての抽出は、「1-10」の「-10」のクリックで次の条文が抽出されるというものです。
    1-10 第十章 最高法規
    1-10-97 第九十七条〔基本的人権の由来特質〕
    1-10-98 第九十八条〔憲法の最高性と条約及び国際法規の遵守〕
    1-10-98-2 第九十八条2項
    1-10-99 第九十九条〔憲法尊重擁護の義務〕

章番号による抽出
  • 押し出しファイリング理論にもかなう
    章番号で「関連情報はひとまとまりにしておけ」ですし、既にある章番号をそのまま活用するので、「分類するな。ひたすら並べよ」にも反しません。

検索期間の指定ができること

  • 検索開始日を指定することで古い情報を除外
    法令改正、規定改正など情報は常に変化しています。最新の情報を参照する必要があります。古い情報は誤りの原因にもなります。
    検索開始日を指定することで古い情報を除外することができます。
    次はサンプルのデータベースから消費税について検索開始日を指定せずに検索した例です。
    検索開始日を指定しないと、初出の記事(この場合は消費税導入日の記事)を冒頭に表示します。現在の消費税率と混同する恐れがあります。
    実際の使用では「▼」で最新の情報にジャンプして最新情報を見るようにしてください。

消費税の変遷
  • 検索終了日の指定することで当時の情報を表示
    検索終了日を指定することにより、指定した日付当時の規定や様子がわかります。
    法令データベースの場合、経過措置があり、旧法を削除できません。改定履歴・沿革は必須です。
    マニュアルの場合、バージョン管理にも必須です。
    次はサンプルのデータベースから消費税について検索終了日を「2001年1月1日」(21世紀初日)に指定して検索した例です。
    再下段の税率が21世紀初日の税率となります。

検索終了日の指定
検索終了日を20010101として検索した例

ハッシュタグが使えること

 関連記事を検索する機会はよくあります。キーワードを検索欄に入力して関連記事を検索するのが通常ですが、そんな作業を省略するのがハッシュタグです。
 記事に「#キーワード」というように#ではじまり、前後を半角スペースで挟んだハッシュタグを記載しておきます。
 データベース化後、ハッシュタグをクリックすると「#キーワード」を含む記事が抽出されるというものです。
 電話応対記録を例にすれば、電話機のナンバーディスプレーに表示された番号を「#03-1234-5678」というように記載しておけば、これまでの電話応対の状況がわかります。
 本稿「文章型データベースを求めて」では、プレーンなテキストファイルにこだわっています。タグ記号をできるだけ排除したいのですが、「#」だけは認めることにします。noteで使えますし、TwitterやInstagram、FacebookなどのSNSで多く使われており、どのアプリでも使えるからです。

ハッシュタグの例

リンクが使えること

 Gメールを活用した情報の整理方法がありますが(別稿参照)、Gメールのリンク機能、添付ファイル機能があって成立する整理方法です。
 html化した文章型データベースにもリンク機能は必須です。

  • 「http://」「https://」ではじまるwebページへのリンク

  • 特定のフォルダ、ファイルへのリンク(添付ファイル)

  • データベース内の他の日付・記事へのリンク

  • 「file:///」ではじまる内部リンク

リンクについて

データベースは使う(出力・印刷)ためにある

データベースは使うためにあります。結果を出力できて使ったことになります。

  • 基本の一日表示・印刷
    新聞スクラップは日付が必須です。webニュースなど「〇〇:〇〇配信」というように時間で整理する方法もありますが、全ての記事に時間を入れることとなり、煩雑です。
    一日表示が使い勝手がよく、基本です。

  • 見出しごとの個別表示・印刷
    一日のうち、関連する情報が集まって「ひとかたまり」となった場合は「見出し」を付けて独立させた方が見やすくなります。
    見出しごとの個別表示は、使用頻度が高いといえます。

  • 見出しと本文の一括表示・印刷
    検索結果を表示する方法として、まず該当するデータの見出しを表示して、次に選択した見出しの本文を表示する方法と、該当するデータの見出しと本文を一括表示する方法があります。
    体験的には後者が優れていると感じます。(検索キーに色付けすれば)

  • 段組み印刷も必須
    印刷はA4サイズが基本です。1件のデータを印刷するだけであれば段組みは必要ありませんが、一括表示して複数のデータを印刷したり、1件のデータであっても長文の場合は2段組み、あるいは3段組みにした方が見やすくなります。

次回予告

 次回は「データベースをスマホで検索・閲覧する方法」を説明します。


この記事が気に入ったらサポートをしてみませんか?