AIXTECH(AIクロステック)

AI開発をメインにしております。(AIを活用した)WebサービスとAIの開発を両方ご提…

AIXTECH(AIクロステック)

AI開発をメインにしております。(AIを活用した)WebサービスとAIの開発を両方ご提案できます。 Whispon合同会社 https://www.whispon.com

マガジン

記事一覧

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization 画像に色のヒントを与えて着色するための拡散モデルです。 どんなもの?: 高度に制御可能…

特別号「構成画像検索(Composed Image Retrieval)」

はじめに: 構成画像検索とは構成画像検索とは、画像とクエリ(テキスト)を使って画像を検索することです。例えば、魚の画像と「折り紙」というワードで画像を検索すれば…

第3号「セマンティックセグメンテーションの高精度化」

Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テ…

第2号「画像編集と動画生成」

Edit One for All: Interactive Batch Image Editingどんなもの 課題:今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。こ…

第1号 「画像生成と3D物体生成」

はじめのご挨拶 コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそ…

写真の解像度を上げるTecoGAN

この記事では写真を高解像度にするTecoGANを紹介します。 写真を撮ったけれど画質が微妙で、もっと綺麗にしたいという時に使うと良いかもしれません。人以外にも風景や生き…

亀裂検出モデルの損失関数を工夫した新しいアプローチ

Fast and Accurate Road Crack Detection Based on Adaptive Cost-Sensitive Loss Function はじめに亀裂検出は事故につながりかねない道路の状況認識のためには重要な問…

物体の形状を分析するアルゴリズム TDA(TopologicalDataAnalysis)フレームワークを調査

 検索して使いやすそうなTDAのフレームワークをまとめました。Pythonも良いものが多いですが、Juliaが特に可視化が綺麗で使ってみようと思いました。Dyonysusは使ったこと…

畳み込み演算についてのメモ書き

 畳み込み演算が分からず論文から新しいニューラルネットワークモデルを実装できずにいたら個人的に師匠だと思っている方から以下の論文を教えてもらいました。この論文の…

壊れてしまった枠をもとに戻す

 線と線をつないで閉じた線にしたいときに使えます。原理としては線を全方向に広げて、線と線をつなげて元の大きさに戻すという処理をしています。画像をパディングしてい…

fastaiのチュートリアルをGoogle Colabで動かす

 この記事では、Jeremy Howard氏が率いる会社「fast.ai」が開発しているディープラーニングのライブラリ「fastai」の猫と犬を認識するチュートリアルを「Google Colab」で…

実行して理解する、早わかりKubernetes

 「Kubernetes(k8s)」は「コンテナ」を本番環境に使っている日本企業全体のうち、約50%以上が使用しているというデータがあります。(IDC Japan 2020) それだけk8sが…

おすすめのAIの学び方

 「AIについて興味があるけどなにから始めたら良いか分からない。」SNSでは好き勝手なことを書いている人が多いのも事実でしょう。この記事の想定受講者像を以下に示しま…

「AIサービス」を作るときのガイドラインを産総研が発表

 機械学習を使った「AIサービス」を作るときに参照するべきガイドラインを産総研が2020年6月30日に発表しました。  AIサービスを作るとき、機械学習のモデルには少なく…

異常検知アルゴリズムを実装

ChangeFinderアルゴリズムを実装しました。 GitHubにはすでに公開されていますが、自分でも実装してみたかったので取り組みました。 このアルゴリズムを実装したら閾値を…

いま必要なのは笑い、そして笑いをデザインする人工知能だ

 家にいるしかないという閉塞感がたちこめているときに「自分にできることはなんだろうか」と考えた人は多いのではないだろうか。私はいまだからこそ笑いが必要だと思う。…

第4号「コンピュータビジョンの深層学習ベース化」

第4号「コンピュータビジョンの深層学習ベース化」


Control Color: Multimodal Diffusion-based Interactive Image Colorization

画像に色のヒントを与えて着色するための拡散モデルです。

どんなもの?: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。

先行研究と比べてどこがすごい?: 複数の条件(テキストプロ

もっとみる
特別号「構成画像検索(Composed Image Retrieval)」

特別号「構成画像検索(Composed Image Retrieval)」


はじめに: 構成画像検索とは構成画像検索とは、画像とクエリ(テキスト)を使って画像を検索することです。例えば、魚の画像と「折り紙」というワードで画像を検索すれば入力した魚に近い折り紙の画像を検索できます。
従来のよくある全部の画像の埋め込みベクトルを事前に計算しコサイン類似度で画像検索するというやり方だと、入力画像との類似画像しか検索できないという問題やクエリを追加して柔軟に検索することができな

もっとみる
第3号「セマンティックセグメンテーションの高精度化」

第3号「セマンティックセグメンテーションの高精度化」


Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません。

先行研究と比べてどこがすごいか: 既存の手

もっとみる
第2号「画像編集と動画生成」

第2号「画像編集と動画生成」


Edit One for All: Interactive Batch Image Editingどんなもの

課題:今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。このような手法を多くの画像に適用するにはどうすれば効率的かということについての課題をこの論文では議論しています。

先行研究と比べてどこがすごい?

新規性: 従来の研究が単一画像の編

もっとみる
第1号 「画像生成と3D物体生成」

第1号 「画像生成と3D物体生成」

はじめのご挨拶

コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそちらから紹介することもあるかと思います。詳細についてはピックアップする記事は少なくとも5~8本は選びたいので、その量から全て把握するのは難しいため、概要を把握するのに論文一つにかける時間を多くは避けません。私はまだまだ精進する身にある

もっとみる
写真の解像度を上げるTecoGAN

写真の解像度を上げるTecoGAN

この記事では写真を高解像度にするTecoGANを紹介します。
写真を撮ったけれど画質が微妙で、もっと綺麗にしたいという時に使うと良いかもしれません。人以外にも風景や生き物など様々な画像に対応しています。自然な変換なのも特徴の一つでしょう。

推論方法TecoGANを動かす環境をローカルで構築しても良いのですが、簡単に実行するためにGoogle Colaboratoryを使用しました。(colabの

もっとみる
亀裂検出モデルの損失関数を工夫した新しいアプローチ

亀裂検出モデルの損失関数を工夫した新しいアプローチ

Fast and Accurate Road Crack Detection Based on Adaptive Cost-Sensitive Loss Function

はじめに亀裂検出は事故につながりかねない道路の状況認識のためには重要な問題です。例えば、道路に大きな穴が開くようなことを未然に防ぐこともできるかもしれません。

この研究では、アーキテクチャーを工夫するような多くの研究とは異な

もっとみる
物体の形状を分析するアルゴリズム TDA(TopologicalDataAnalysis)フレームワークを調査

物体の形状を分析するアルゴリズム TDA(TopologicalDataAnalysis)フレームワークを調査

 検索して使いやすそうなTDAのフレームワークをまとめました。Pythonも良いものが多いですが、Juliaが特に可視化が綺麗で使ってみようと思いました。Dyonysusは使ったことがあるのですが、他はまだ試したことがないのでコメントできませんでした。

PythonDionysus 2
scikit-tda
giotto-tda

JuliaTDA.jl
Sparips.jl
HomotopyC

もっとみる
畳み込み演算についてのメモ書き

畳み込み演算についてのメモ書き

 畳み込み演算が分からず論文から新しいニューラルネットワークモデルを実装できずにいたら個人的に師匠だと思っている方から以下の論文を教えてもらいました。この論文の公式をTensorflowで確かめてみました。

 検証コードは以下にあります。これで畳み込み演算は少し慣れた気がします。精進!精進!

___________________________________________________

もっとみる
壊れてしまった枠をもとに戻す

壊れてしまった枠をもとに戻す

 線と線をつないで閉じた線にしたいときに使えます。原理としては線を全方向に広げて、線と線をつなげて元の大きさに戻すという処理をしています。画像をパディングしている理由は一度画像の端が黒になってしまった場合、縮小してももとに戻せないからです。
 この説明では具体的なイメージを掴みづらいと思うので以下のColabでコードを確認してください。

 具体的な使用シーンはGANなどで生成した物体の線が切れて

もっとみる
fastaiのチュートリアルをGoogle Colabで動かす

fastaiのチュートリアルをGoogle Colabで動かす

 この記事では、Jeremy Howard氏が率いる会社「fast.ai」が開発しているディープラーニングのライブラリ「fastai」の猫と犬を認識するチュートリアルを「Google Colab」で動かします。

インストール Google ColabとはPythonの環境をローカルにインストールせずとも使えるサービスです。Googleアカウントでログインして使いましょう。

 起動ができたらまず

もっとみる
実行して理解する、早わかりKubernetes

実行して理解する、早わかりKubernetes

 「Kubernetes(k8s)」は「コンテナ」を本番環境に使っている日本企業全体のうち、約50%以上が使用しているというデータがあります。(IDC Japan 2020) それだけk8sが注目されているということでしょう。この記事では今注目のk8sを動かしながら理解するのが目的です。最後まで記事を読みながら動かすとk8sについての理解が少し深まるかもしれません。

「コンテナ」を管理するソフト

もっとみる
おすすめのAIの学び方

おすすめのAIの学び方

 「AIについて興味があるけどなにから始めたら良いか分からない。」SNSでは好き勝手なことを書いている人が多いのも事実でしょう。この記事の想定受講者像を以下に示します。

・AIを実装したことがないけどしてみたい。
・プログラミングは得意ではない。
・ライブラリも詳しくない

 では、AIを学ぶために一番良い方法は何かと言えばまずは実装してみることです。実装と言ってもプログラミングするだけではあり

もっとみる
「AIサービス」を作るときのガイドラインを産総研が発表

「AIサービス」を作るときのガイドラインを産総研が発表

 機械学習を使った「AIサービス」を作るときに参照するべきガイドラインを産総研が2020年6月30日に発表しました。

 AIサービスを作るとき、機械学習のモデルには少なくとも学習データとテストデータが必要です。このとき、モデルを一度作ったら終わりではなく学習したモデルに新しいデータを加えて再度学習する「追加学習」のプロセスを考える必要もあります。

 今回発表されたガイドラインを読むと、たとえば

もっとみる
異常検知アルゴリズムを実装

異常検知アルゴリズムを実装

ChangeFinderアルゴリズムを実装しました。
GitHubにはすでに公開されていますが、自分でも実装してみたかったので取り組みました。

このアルゴリズムを実装したら閾値を決めるだけで変化点検知ができます。

ソースコードは以下のcolabにあります。

Gistにも
https://gist.github.com/Ooshita/a9d46f846de73c859668c02906836

もっとみる
いま必要なのは笑い、そして笑いをデザインする人工知能だ

いま必要なのは笑い、そして笑いをデザインする人工知能だ

 家にいるしかないという閉塞感がたちこめているときに「自分にできることはなんだろうか」と考えた人は多いのではないだろうか。私はいまだからこそ笑いが必要だと思う。行動することもできないのなら、笑うことしか人間にはできない。

 誰かを批判するのではなく笑って過ごして、また誰かと一緒に笑える、そんな日を目指そうではないか。

 前置きはここまでとして、本記事では「笑いと人工知能」についてとりあげる。

もっとみる