見出し画像

複数のLLMから選んで作るマイAI 「Hugging Chat Assistant」


6つのLLMを選択可能

Hugging Faceの「Hugging Chat Assistant」を試しました。
カスタムのAIチャットを作成できます。

使用するにはアカウントを取得します。
ChatGPT Plusで使える「GPTs」の簡易版のような機能構成ですが、LLMを選択できるなど、Hugging Faceらしい仕様を備えます。

2024年2月13日時点で以下の6つを選択できます。

APIの仕様をInstructionsに

統計ダッシュボード」のAPIの仕様を「Instructions」に記載しました。
プレーンテキストにすると文章構造が崩れるので、利用方法のページのHTML をそのまま使っています(なんとなくこの方がいいと思っただけなので、有効かどうかわかりません)。
質問は

XMLの「統計データ」を取得するためのリクエストURLは?

に統一。LLMを変更して問い合わせました。
なお、正解は

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?

です。
getData?」に続くパラメータは記載しておらず、参照先のPDFのURLのみ載せています。

※生成AIでは、同じ質問をしても異なる回答を戻すことがあります。以下に記載している回答も、必ず毎回同じ内容になるわけではないということをご了承ください。

mistralai/Mixtral-8x7B-Instruct-v0.1

The request URL for obtaining statistical data in XML format is as follows:

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?

You can add the necessary parameters to this base URL to specify what data you want to obtain. For example, if you wanted to obtain data on population by prefecture and gender, your final URL might look something like this (assuming that the parameter values have been properly encoded):

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?Lang=JP&IndicatorCode=0000010000000010000&RegionalRank=2&Gender=1

For more information on the available parameters and their meanings, please refer to the documentation provided with the API or contact its developers directly.

(翻訳:DeepL)
統計データをXML形式で取得するためのリクエストURLは以下の通り:

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?

この基本URLに必要なパラメータを追加して、取得したいデータを指定することができます。例えば、都道府県別人口と男女別人口のデータを取得したい場合、最終的なURLは次のようになります(パラメータ値が適切にエンコードされていると仮定します):

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?Lang=JP&IndicatorCode=0000010000000010000&RegionalRank=2&Gender=1

利用可能なパラメータとその意味についての詳細は、APIと一緒に提供されているドキュメントを参照するか、開発者に直接お問い合わせください。

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?」はドキュメントの記載通りです。
https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?Lang=JP&IndicatorCode=0000010000000010000&RegionalRank=2&Gender=1」は404エラーでしたが、基本のスタイルはInstructionsの内容に沿っています。

meta-llama/Llama-2-70b-chat-hf

XMLの統計データ取得を取得するためのリクエストURLは、以下の通りです。
JSON-stat形式:https://dashboard.e-stat.go.jp/api/1.0/JsonStat/getData?Lang=JP&IndicatorCode=0201020000000010000&RegionalRank=3&Cycle=3&IsSeasonalAdjustment=1&MetaGetFlg=Y&SectionHeaderFlg=1
CSV形式:https://dashboard.e-stat.go.jp/api/1.0/Csv/getData?Lang=JP&IndicatorCode=0201020000000010000&RegionalRank=3&Cycle=3&IsSeasonalAdjustment=1&MetaGetFlg=Y&SectionHeaderFlg=1


これらの URL は、統計データの Lang が JP (日本語) であること、IndicatorCode が 0201020000000010000 (統計項目コード) であること、RegionalRank が 3 (都道府県別) であること、Cycle が 3 (年次) であること、IsSeasonalAdjustment が 1 (季節調整有) であることを示しています。また、 MetaGetFlg が Y (true) であること、SectionHeaderFlg が 1 ( true) であることを示しています。

これらのパラメータを設定することで、指定された統計データを取得することができます。

XMLではなく、JSONとCSVに対しての回答でした。
上記2つのクエリーURLは、ドキュメントに記載してあるサンプルクエリーと同じです。

NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO

XMLの統計データ取得を行うためのリクエストURLは、以下のようになります。

`https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?`

このURLには、取得したい統計データの情報をパラメータとして追加する必要があります。具体的なパラメータの例や詳細な使い方については、APIの詳細仕様を参照してください。

リクエストURLに追加するパラメータは以下の通りです。

- `Lang`:取得する言語コード(JP:日本語、EN:英語)
- `IndicatorCode`:取得したい系列コード
- `RegionalRank`:取得する地域階級(1:国、2:全国(日本)、3:都道府県、4:市区町村)
- `Cycle`:取得するデータ周期(1:月、2:四半期、3:年、4:年度)
- `IsSeasonalAdjustment`:季節調整の指定(0:元データ、1:季節調整データ)
- `MetaGetFlg`:統計メタ情報の取得フラグ(Y:取得する、N:取得しない)
- `SectionHeaderFlg`:セクションヘッダの取得フラグ(1:取得する、0:取得しない)

パラメータ間は「&」で区切り、各パラメータは「パラメータ名=値」の形式で指定してください。例えば、「月」データ、「就業者(男)」

リクエストURLに追加するパラメータ」は、参照先として記載してあるURL(PDF)からピックアップしているようです。
今回の回答の中で一番適している内容です。
(ただ、他のLLM同様に同じ問いに対し異なる回答を返すこともあります)

codellama/CodeLlama-70b-Instruct-hf

以下のリクエストURLを使用して、XML形式の統計データを取得できます。

https://dashboard.e-stat.go.jp/api/1.0/Xls/getStatsList?appId=[APPID]

[APPID]は、自分のアカウントから発行されたアプリケーションIDに置き換えてください。

注意:このリクエストURLは、XML形式のみを返します。他のフォーマットへの変換は手動で行う必要があります。

統計ダッシュボードのAPIは利用登録不要のため、アプリケーションIDを使いません。

mistralai/Mistral-7B-Instruct-v0.2

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData? Lang=JP & IndicatorCode=XXXXXXX & RegionalRank=YYY & Cycle=ZZZ & IsSeasonalAdjustment=AAA & MetaGetFlg=BBB & SectionHeaderFlg=CCC

Replace XXXXXX with the indicator code, YYY with regional rank, ZZZ with cycle, AAA with seasonal adjustment flag and CCC with section header flag values as per your requirement.

(翻訳:DeepL)
https://dashboard.e-stat.go.jp/api/1.0/Xml/getData? Lang=JP & IndicatorCode=XXXXXXX & RegionalRank=YYY & Cycle=ZZZ & IsSeasonalAdjustment=AAA & MetaGetFlg=BBB & SectionHeaderFlg=CCC

XXXXXXを指標コードに、YYYを地域ランクに、ZZZを周期に、AAAを季節調整フラグに、CCCをセクション・ヘッダ・フラグの値に、要件に従って置き換えます。

返事は英語ですが、パラメータ一覧のPDFを参照して答えを引き出してくれているようです。

openchat/openchat-3.5-0106

XMLフォーマットで統計データを取得するためのリクエストURLは以下です。

https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?

次へのリクエスト例: center;">https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?Lang=JP&IndicatorCode=0201020000000010000&PeriodType=Trend&StartDate=20190101&EndDate=20190102&IsSeasonalAdjustment=1&MetaGetFlg=Y

2番目のリクエストURLをどこから参照しているのかわかりませんでした(404です)。
/api/1.0/Xml/getData?のパラメータ一覧には「PeriodType」の記載はありませんでした。

Instructionsに載せてない内容を問う

Instructionsには記載していない情報について聞いてみます。
今回の質問は、

統計データ取得」の際に使用するリクエスト
https://dashboard.e-stat.go.jp/api/1.0/Xml/getData?
で使用できる「RegionLevel」のパラメータの意味は?

です。
Instructionsには直接記載していませんが、パラメータ一覧のPDFへのURLは載せています。

正解はこちらです。

いずれのLLMもそれらしい回答をしてくれますが、Instructionsからは辿れない参照先から引っ張ってきている、もしくはLLMにすでに学習されている情報を使っているようです。
(つまり、ばっちりの正解を回答してくれなかったということです)

mistralai/Mixtral-8x7B-Instruct-v0.1

The RegionLevel parameter in the URL for "統計データ取得 (Statistics Data Retrieval)" specifies the level of geographical granularity for the retrieved statistical data. Here are possible values and their meanings:1: National level ( Japan as a whole )
2: Prefectural level
3: Municipal level

For example, if you set it to 3, you will get the statistics broken down by each municipality within Japan.

(翻訳:DeepL)
統計データ取得」のURLのRegionLevelパラメータは、取得する統計データの地理的な粒度を指定します。

1:全国レベル(日本全体)
2: 都道府県レベル
3: 市区町村レベル

例えば、3 に設定すると、日本の各市区町村別に統計データを取得することができます。

meta-llama/Llama-2-70b-chat-hf

` RegionLevel` パラメータは、統計データの地域区分を指定するために使用されます。以下は、その意味の一覧です。

| RegionLevel | Description |
| --- | --- |
| 1 | 都道府県 |
| 2 | 市町村 |
| 3 | 特別区 |
| 4 | 郡 |
| 5 | 町 |
| 6 | 村 |
| 7 | 字 |

例えば、`RegionLevel=1` とした場合、都道府県レベルの統計データを取得することができます。`RegionLevel=2` とした場合、市町村レベルの統計データを取得することができます。どのように使用するかは、具体的な需要に応じて選択する必要があります。

NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO

「RegionLevel」は、データの地域レベルを示すパラメータです。以下に各値の意味を示します。

- 1: 国 (全国)
- 2: 都道府県
- 3: 市区町村
- 4: 地域

例えば、「RegionLevel=2」とすることで、都道府県レベルのデータを取得できます。

ただし、実際に利用できる地域レベルは、指定した統計データ(系列)によって異なります。指定可能な地域レベルは、「統計メタ情報(地域)取得」で調べることができます。

「統計メタ情報(地域)取得」のベースURLは https://dashboard.e-stat.go.jp/api/1.0/Xml/getRegionInfo? です。
例えば、都道府県レベルのデータが取得できるかどうかを調べる場合は以下のように指定します。

https://dashboard.e-stat.go.jp/api/1.0/Xml/getRegionInfo?Lang=JP&ParentRegionCode=00000

上記のリクエストで、「RegionLevel」の値が2(都道府県)になっている項目が存在すれば、その統計データは都道府県レベルのデータが取得できることを示しています。

codellama/CodeLlama-70b-Instruct-hf

リクエスト https://dashboard.e-stat.go.jp/api/1.0/Xml/getData? では、`RegionLevel` パラメータは地域分類の深度を指定するために使用されます。以下に `RegionLevel` の各値の意味を示します。

* RegionLevel = 1 : 都道府県
* RegionLevel = 2 : 市区町村
* RegionLevel = 3 : 特別区
* RegionLevel = 4 : 小選択区分
* RegionLevel = 5 : 中選択区分
* RegionLevel = 6 : 大選択区分
* RegionLevel = 7 : 集計基準地域

`RegionLevel` パラメータの設定は任意です。省略するか、0 (ゼロ) を指定すると、地域分類は返されません。

mistralai/Mistral-7B-Instruct-v0.2

The "RegionLevel" parameter in the request URL for getting statistical data using XML format (<https://dashboard.e-stat.go.jp/api/1.0/Xml/getData>) specifies the level of regional aggregation for the returned data. It determines how detailed or summarized the geographical information will be presented in the response. Here are some possible values and their meanings:

* `0` (or no RegionLevel specified): Data is not broken down by region, only national-level statistics are provided.
* `1`: Prefectural-level data is included in the response.
* `2`: City or ward-level data is included in the response.
* `3`: Statistical area level 1 (SA1) data is included in the response. SA1 refers to small areas defined based on various socioeconomic criteria.
* `4`: Statistical area level 2 (SA2) data is included in the response. SA2 refers to larger areas that group several smaller areas together.

By setting an appropriate value for the RegionLevel parameter, you can customize the granularity of the geographic information you want to retrieve from the API.

(翻訳:DeepL)
XML形式(<https://dashboard.e-stat.go.jp/api/1.0/Xml/getData>)で統計データを取得するためのリクエストURLの "RegionLevel "パラメータは、返されるデータの地域集計レベルを指定する。これは、レスポンスにおいて地理的情報がどの程度詳細に表示されるか、または要約されるかを決定します。以下は指定可能な値とその意味である:

* 0` (または RegionLevel を指定しない): 0` (または RegionLevel を指定しない): データは地域別に分類されず、国レベルの統計のみが提供される。
* `1`: 1`: 都道府県レベルのデータが回答に含まれる。
* `2`: 2`: 市区町村レベルのデータが含まれます。
* `3`: 3`:統計地域レベル1(SA1)のデータが回答に含まれる。3`:統計地域レベル1(SA1)のデータが回答に含まれる。
* `4`: 統計地域レベル2(SA2)のデータが回答に含まれます。SA2は、いくつかの小さな地域をグループ化した、より大きな地域を指します。

RegionLevel パラメータに適切な値を設定することで、API から取得する地理情報の粒度をカスタマイズできます。

openchat/openchat-3.5-0106

"統計データ取得" APIのURLに付属している「RegionLevel」パラメータは次のように定義されています。

| RegionLevel | 意義 |
|-------------------|---------------|
| 1 | 全国全体 (allCountries) |
| 2 | 4つの統計区分 (regions) |
| 3 | 20の都市 (cities) |
| 8 | 47の町市区 (areas) (Category=020202002001) |
| 9 | 39の村 (villages) (Category=020202002001) |
| 10 | 10の自治体 (prefPOnects) (Category=020202002001) |

例えば、RegionLevel = 1の場合、全国全体の統計データを取得するという意味です。同様に、RegionLevel = 2の場合、4つの統計区分のデータを取得するような意味になります。Category引数を含むパラメータはそれらのカテゴリーのデータを取得するように制限されます。


この記事が気に入ったらサポートをしてみませんか?