マガジンのカバー画像

エンジニアたちの「やってみた!」

42
さまざまなツールやライブラリを使って、朝日新聞のエンジニアたちが「やってみた」エントリを紹介します! 朝日新聞に登場したデータ活用や頭をやわらかくするクリエイティブなコンテンツま…
運営しているクリエイター

#朝日新聞社テックブログ

桜だより〜関西地方の開花推移〜

桜だより〜関西地方の開花推移〜


こんにちは。メディア研究開発センターの河﨑です。
春ですね。大都会東京の花粉の多さに慄きながら、日々過ごしています。
(私の大好きな故郷大阪よりも花粉が多いそうで、、やってられないです)

新聞社に入社したので、学生の頃より新聞を読む機会が増えました。
新聞には「その日の情報」がとてもたくさん載っています。
今日の新聞を見ることで、今何が起こっているかがわかる。
過去の新聞を見れば、その時何が起

もっとみる
今日からはじめるAI文芸実践入門:クリスマスとお正月の間の空白をテーマにした音楽をつくる

今日からはじめるAI文芸実践入門:クリスマスとお正月の間の空白をテーマにした音楽をつくる

はじめにみなさん、こんにちは。メディア研究開発センターの浦川です。私は普段、自然言語処理(書き言葉から話し言葉まで、日常生活で普通にヒトが使う言葉をコンピュータで扱うこと)に関する研究開発に従事しています。これまでに、自動で記事の見出しを生成する「TSUNA」や、短歌を生成する「短歌AI」などに携わってきました。

さて、本連載では「〈言葉〉による表現を計算機とともにおこなう人へ向けて、今日から実

もっとみる
街にもクマは現れる!宮城県「アーバン・ベア」の出没地点を可視化しました

街にもクマは現れる!宮城県「アーバン・ベア」の出没地点を可視化しました


はじめにこんにちは。メディア研究開発センター(M研)の石井です。
現在は主にデータジャーナリズムなどを担当しています。

メディア研究開発センターでは、自然言語処理をはじめとした人工知能研究などに取り組む一方、記者の問題意識と、M研の技術を掛け合わせた「データジャーナリズム」にも力を入れています。
今回は、その中の一つの事例として「アーバン・ベア 動くクママップ」をご紹介します。

近年、「アー

もっとみる
最近公開された日本語LLMを要約生成タスクで検証してみる

最近公開された日本語LLMを要約生成タスクで検証してみる

こんにちは。メディア研究開発センター(M研)の田口です。

最近、大規模言語モデル(以下、LLM)に関するニュースが毎日のように出ています。直近約1ヶ月の間にもOpenAIのAPIのアップデートが発表されたり、日本語のLLMが公開されたりしました。

少し前(といっても4月末)に「ChatGPT/OpenAI API/LLM活用事例~NewsPicksと朝日新聞の合同勉強会を公開」でLTをしました

もっとみる
ジオコーディングツールは難しい住所をどこまで解析できるのか

ジオコーディングツールは難しい住所をどこまで解析できるのか

おはようございます。メディア研究開発センターの新妻です。

つい先日、日本の住所を扱うことの難しさがインターネットで話題になってましたね。
日本の住所は、県、市区町村、町名、字、番地…と書き方のルールが一見存在しているように見えて、ルールをはみ出るような例外が非常に多く、ルールで処理するのが比較的難しいという問題があります。
(※日本の住所以外はルールに基づいているからこう言っているのではなく、筆

もっとみる
(新しい時代の)論文の歩き方

(新しい時代の)論文の歩き方

はじめにメディア研究開発センター(M研)の田森です。

私は一応管理職の身なので、近年は事務作業に追われ(涙)ていることを言い訳に、あまり論文を読んだり、研究が思うようにできたりしていません。
スティーブ・ジョブズの、ある演説の有名な言葉に

というのがあります。この言葉を思い出し(?)正月の物欲にも任せてiPadを購入し、いつでもどこでも読めるよう物理的な環境だけは刷新しました。

一方で、ずっ

もっとみる
新人配属3ヶ月!はじめての取り組み【Mapbox を用いた人口密度の可視化】

新人配属3ヶ月!はじめての取り組み【Mapbox を用いた人口密度の可視化】

はじめにはじめまして。メディア研究開発センターの石井と申します。

2022年4月に朝日新聞社に新卒で入社し、9月にメディア研究開発センターに配属されました。
今回は、配属されてからこれまでの3ヶ月の中で取り組んだ「Mapbox を用いた人口密度データの可視化」に関してご紹介します。

就活生をはじめとして、朝日新聞社、メディア研究開発センターの仕事に興味を持ってくださっている皆様にとって、少しで

もっとみる
日本地図で地名の分布を見てみた

日本地図で地名の分布を見てみた

メディア研究開発センターの新妻です。
※本記事はQiitaの朝日新聞社アドベントカレンダー(6日目)にも参加しています。

字名(あざな)はその土地の地形や地質を表している?地名はその土地の特徴が由来している、なんて話を聞いたことがないでしょうか。例えば、台地に位置しているような場所には、東京都文京区の「目白台」や奈良県生駒市の「白庭台」といった◯◯台といった地名がついていたりします。そんな話を聞

もっとみる
類似事例を使って要約モデルの性能を向上させる

類似事例を使って要約モデルの性能を向上させる

こんにちは。メディア研究開発センター(M研)の田口です。

今回は、自然言語処理のトップ会議であるACL2022で採択された “Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data”の内容と、その手法を日本語の見出し生成タスクで実験し

もっとみる
【AWS SAA】Solution Architect Associateとってみた【勉強方法】

【AWS SAA】Solution Architect Associateとってみた【勉強方法】

こんにちは。M研の村瀬です。私事ですが、3月にAmazon Web Service(以下AWS)の認定資格Solution Architect Associate(以下SAA) を取得しました。今回は資格取得までに私がやったことや、やっておいて良かった事などなどを皆さんに共有したいと思います。このブログが誰かのSAA取得の一助になりますと幸いです。

AWS 認定資格Solution Archit

もっとみる
【Text-to-Image】AI画像生成で桃太郎を4コマ画像要約してみた【DALL・E 2/Midjourney/StableDiffusion】

【Text-to-Image】AI画像生成で桃太郎を4コマ画像要約してみた【DALL・E 2/Midjourney/StableDiffusion】

はじめにこんにちは。メディア研究開発センター所属の新美です。
私は小さい頃から大の漫画好きでして、学生時代、歴史の勉強はほとんど漫画で覚えていました。活字だけで読むよりも漫画などでイラストと一緒に読む方が頭に入るんですよね。(新聞社に勤めている身としてはいかがなものかと思われますが)
そんなわけで全ての読み物に挿絵がついていたり、文章を画像で要約してくれたらいいのにな〜と昔から思っていたのですが、

もっとみる
人流オープンデータを使って時系列変化を可視化してみた

人流オープンデータを使って時系列変化を可視化してみた

こんにちは。M研の尾崎です。世の中にはいろんなオープンデータが公開されていますが、大手携帯電話会社のスマホアプリなどからの位置情報を匿名化/統計加工したデータを使って、人の流れがどのように変化しているかがわかる人流データが公開されています。新型コロナウイルス感染症の拡大で、感染を抑える一つの有力な政策として、人流を制限することが挙げられました。こういった人流データの分析がなされ、飲食店の時短営業要

もっとみる
yabaiとskhdで爆速ウィンドウ操作環境を構築してみた

yabaiとskhdで爆速ウィンドウ操作環境を構築してみた

はじめにこんにちは。
メディアラボチームで新規事業に取り組んでいる市野です。

PCを利用する上で避けられないウィンドウ操作 (アプリケーションを開いたときに表示されるあれです) 。表示されたあとに、適切なサイズに変更したり、他のウィンドウと被らないように位置を変更することも多いのではないでしょうか。

これって地味に時間がかかる細かい作業ですよね、、、

もし、マウスを使わずにキーボードショート

もっとみる
Tesseract v4に特定のフォントを学習させる ~ 画像のデノイジング処理を添えて ~

Tesseract v4に特定のフォントを学習させる ~ 画像のデノイジング処理を添えて ~

メディア研究開発センターの倉井です。
最近Tesseractを使ってOCRをしたいことがあったのですが、新たにフォントを学習させたい場合など、いくつか初見では難しい設定をする必要があったので、備忘録的に残したいと思います。
合わせて元の画像のノイズをopenCVを使って取り除き、綺麗にする方法も共有したいと思います。

なお、検証に当たって大いに参考にさせていただいたWebページのリンクを最後にま

もっとみる