見出し画像

翻訳者が調べ物にサクッと使えるデータベース/コーパス/リポジトリ

翻訳者の間でも調べ物にChatGPTなどのAIを利用する人が増えています。とはいえ、やはり基本は従来の方法でしょう。翻訳には納期や〆切りがあり、調べなければならないことは次から次から湧いて出てきます。時間のない翻訳者のために、ワンクリックで簡単に無料で検索できるデータベースやリポジトリ、コーパスを集めてみました。

【お知らせ】2024年3月末で WebcatPuls のサービス提供が終了してしまいました。書籍の検索には CiNii Books(国立情報学研究所)や 国立国会図書館サーチ NDL Search(国立国会図書館)などが利用できるものの、WebcatPuls が便利だったので、大変残念です。国立国会図書館サーチは今年大幅にニューアルされましたので、後日利用法など詳細を掲載予定です。


横浜市立図書館 蔵書探索AI

2024年1月15日から横浜市立図書館蔵書検索にAI探索が導入されました。本を探すだけならだれでも利用できます。横浜市システム改変内容の詳細はこちら

下の検索画面を開くと、検索窓の下に利用方法が表示されています。

キーワードを入れると下記のように関連する図書が表示されます。

「母から逃れたい娘」で検索

WebcatPuls の進化型と言えるかも知れません。

少納言 「現代日本語書き言葉均衡コーパス」検索ツール

大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した『現代日本語書き言葉均衡コーパス』(BCCWJ:Balanced Corpus of Contemporary Written Japanese)のデータを検索できるサイトです。簡単にコンコーダンス検索ができます。

検索画面(前後の文脈を設定していない画面)

例えば「家付き」という言葉を前後の文脈を設定せずに検索すると、9件ヒットしました。

上図の左側を拡大してみました。検索文字列欄に「家付き」が入り、その前後の文脈が表示されます。訳語選びで文脈的に適切かどうかを確認できます。

使用する場合は、下記リンクをクリックし、最下段のボタンを押して「利用条件」に同意すればすぐに使用できます。

中納言というコーパス検索アプリケーションもあるのですが、研究者向けで検索設定が複雑な上に利用に申請が必要です。

Googleブックス検索オプション

Googleブックスの検索オプションを使うと全文検索ができ、スニペット表示もされるので、引用されている書籍や引用箇所も探し出せます。ただし、表示されるページ番号などはいい加減なので、正確な箇所は現物に当たる必要があります。OCRがうまくできていない箇所も少なくないので、ヒットするけど書籍に当たると載っていないとか、載っているはずなのにヒットしないことがままあるようです。

「わが名はガンテンバイン」で検索


Ngram Viewer

Ngram Viewer は書籍中の語句使用頻度をグラフ化できるツールです。どの時代に、あるいはどの時代から使用されていたかがある程度分かります。

NDL Ngram Viewer

NDL Ngram Viewer は国立国会図書館の提供するデジタル化資料のOCR全文テキストデータを利用したものです。検索時には正規表現を利用したクエリが可能です。2000年以降はまだデジタル化資料が少ないようであまり当てにならない気がします。


「銅臭」で検索

Google Books  Ngram Viewer

Google Books を利用したNgram Viewer です。5世紀前から現代までの書籍で解析されます(現在のところ2019年まで)。言語はアメリカ英語、イギリス英語、英語のフィクション、ヘブライ語、イタリア語、中国語、フランス語、ドイツ語、ロシア語、スペイン語などに切り替えられます。

ドイツ語バージョンで「 moin moin」を検索


GoogleScolar

GoogleScolarはGoogleが提供する論文検索。日本語や英語だけでなく他言語論文も、分野に関係なく幅広く検索できます。


学術機関リポジトリ/データベース

科学技術情報発信・流通総合システム(J-STAGE)

国立研究開発法人科学技術振興機構 (JST) が運営する電子ジャーナルプラットフォーム。日本から発表される科学技術(人文科学・社会科学を含む)情報の迅速な流通と国際情報発信力の強化、オープンアクセスの推進を目指し、学協会や研究機関等における科学技術刊行物の発行を支援。
現在は、国内の1,500を超える発行機関が、3,000誌以上のジャーナルや会議録等の刊行物を公開。

その他のリポジトリ

学術機関リポジトリ(IRDB)は、「本文あり」のタブでヒットした論文はすぐに読めます

CiNii(サイニー)は日本語の論文や大学図書館の本、雑誌、博士論文の情報が検索できますが、オープンアクセスでない文献が多いと思います。利用方法としては、例えば「出ているはずの洋書を探す」等があります。それについては『調べる技術』(皓星社)の著者で図書館情報学研究者の小林昌樹さんが「洋書はCiNii。それって常識?――出たはずの本を見つける」という記事を書いておられます。


映画データベース

allcinema

映画は、日本で劇場公開、テレビ放映、ソフト化、配信された洋画全般、日本で戦後公開、ソフト化、配信された邦画全般が網羅されています。そのほかアニメやテレビドラマも入れられています。
作品名だけでなく人名の検索もできますし、なによりあいまい検索ができるので、うろ覚えのタイトルでも見つかります。

Filmarks

allcinema と同じような映画データベースですが、製作国で検索できます。東ドイツ、オランダ領アンティル、チベット自治区など、マニアックなインデックスも網羅されています。

翻訳作品リスト

ameqlist 翻訳作品集成

個人で作成されている作家別翻訳作品のリスト。
SF、ホラー、ミステリ、文学等の海外作品の翻訳作品のタイトルをまとめてくださっているので、忘れられた作家の短編などが古い全集に翻訳で掲載されているのを見つけたりして、ずいぶん助けられています。


電子図書館

国立国会図書館デジタルコレクションは、デジタル化/OCRされた冊数が飛躍的に増えました。また青空文庫、project Gutenbergには主に著作権が消滅した作品が全文テキスト公開されています。

国立国会図書館

★国会図書館利用案内

青空文庫

Project Gutenberg

ドイツ語ポータルもあります。


蔵書・在庫検索

カーリル(図書館蔵書検索システム)

全国の図書館の蔵書を検索できます。一度に検索できる図書館は10箇所まで(設定が必要)。借りられないにしても、大学図書館や国会図書館の蔵書も検索可能です。

カーリルローカル

都道府県をまとめて検索できる「カーリルローカル」もあります。公立図書館と大学図書館が一気に検索できます。

Libron

Libron は Amazon のページから最寄りの図書館の蔵書を検索できるツールです(ブラウザの拡張機能)。ブラウザにインストールしてAmazonにアクセスするだけで、すぐにご利用できます。
ただ、一回の検索で設定できるのは一箇所の図書館だけです。

オンライン書店・古書店在庫検索

オンライン書店、古本屋の横断検索システム。複数のオンライン書店から、本や古本の価格・在庫状況を一括検索できます。

親サイトは、書評や学術論文、電子書籍などを検索できるサイトです。


その他の便利なサイト

ふりがな文庫

漢字を入れると読み仮名が、読みを入れると漢字が表示されます。

「おうじゅうかんよう」の漢字を知るために引いた例


国立国会図書館リサーチナビ

調べものに役立つ情報を紹介する国立国会図書館の調べ方案内です。


レファレンス協同データベース

全国の図書館利用者による問い合わせと返答事例のデータベースです。ネット検索しているとたまにヒットしてありがたいサイトですが、わたしは知らない新語や既存語の新しい意味などを調べたいときに時々使っています。

なにより調べ物のプロによってきちんと裏取りされているし、調査した辞書類が(記載があってもなくても)明記されているのでありがたいです。

「世界線」を引いた例





以上です。また何か見つけたら追加します(2024年3月10日現在)

この記事が気に入ったらサポートをしてみませんか?