AIXTECH（AIクロステック）

AI開発をメインにしております。（AIを活用した）WebサービスとAIの開発を両方ご提…

6 フォロー 11 フォロワー

週刊コンピュータービジョン

AIXTECH（AIクロステック）

5本

arxivのコンピュータービジョンを週刊でピックアップし、ご紹介します。
深掘り！コンピュータビジョン！

AIXTECH（AIクロステック）

0本

週刊で扱った論文を深掘りして書くマガジンです。
AI TIPS

AIXTECH（AIクロステック）

4本

AI開発をちょっと便利にする技術を紹介します。

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization 画像に色のヒントを与えて着色するための拡散モデルです。どんなもの？: 高度に制御可能…

AIXTECH（AIクロステック）

8か月前

特別号「構成画像検索（Composed Image Retrieval）」

はじめに: 構成画像検索とは構成画像検索とは、画像とクエリ（テキスト）を使って画像を検索することです。例えば、魚の画像と「折り紙」というワードで画像を検索すれば…

AIXTECH（AIクロステック）

8か月前

第3号「セマンティックセグメンテーションの高精度化」

Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テ…

AIXTECH（AIクロステック）

8か月前

第２号「画像編集と動画生成」

Edit One for All: Interactive Batch Image Editingどんなもの課題：今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。こ…

AIXTECH（AIクロステック）

9か月前

第1号「画像生成と3D物体生成」

はじめのご挨拶コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそ…

AIXTECH（AIクロステック）

9か月前

写真の解像度を上げるTecoGAN

この記事では写真を高解像度にするTecoGANを紹介します。写真を撮ったけれど画質が微妙で、もっと綺麗にしたいという時に使うと良いかもしれません。人以外にも風景や生き…

AIXTECH（AIクロステック）

2年前

亀裂検出モデルの損失関数を工夫した新しいアプローチ

Fast and Accurate Road Crack Detection Based on Adaptive Cost-Sensitive Loss Function はじめに亀裂検出は事故につながりかねない道路の状況認識のためには重要な問…

AIXTECH（AIクロステック）

3年前

物体の形状を分析するアルゴリズム TDA（TopologicalDataAnalysis）フレームワークを調査

　検索して使いやすそうなTDAのフレームワークをまとめました。Pythonも良いものが多いですが、Juliaが特に可視化が綺麗で使ってみようと思いました。Dyonysusは使ったこと…

AIXTECH（AIクロステック）

3年前

畳み込み演算についてのメモ書き

　畳み込み演算が分からず論文から新しいニューラルネットワークモデルを実装できずにいたら個人的に師匠だと思っている方から以下の論文を教えてもらいました。この論文の…

AIXTECH（AIクロステック）

3年前

壊れてしまった枠をもとに戻す

　線と線をつないで閉じた線にしたいときに使えます。原理としては線を全方向に広げて、線と線をつなげて元の大きさに戻すという処理をしています。画像をパディングしてい…

AIXTECH（AIクロステック）

3年前

fastaiのチュートリアルをGoogle Colabで動かす

　この記事では、Jeremy Howard氏が率いる会社「fast.ai」が開発しているディープラーニングのライブラリ「fastai」の猫と犬を認識するチュートリアルを「Google Colab」で…

AIXTECH（AIクロステック）

3年前

実行して理解する、早わかりKubernetes

　「Kubernetes（k8s）」は「コンテナ」を本番環境に使っている日本企業全体のうち、約50％以上が使用しているというデータがあります。（IDC Japan 2020）　それだけk8sが…

AIXTECH（AIクロステック）

3年前

「AIサービス」を作るときのガイドラインを産総研が発表

　機械学習を使った「AIサービス」を作るときに参照するべきガイドラインを産総研が2020年6月30日に発表しました。　AIサービスを作るとき、機械学習のモデルには少なく…

AIXTECH（AIクロステック）

4年前

異常検知アルゴリズムを実装

ChangeFinderアルゴリズムを実装しました。 GitHubにはすでに公開されていますが、自分でも実装してみたかったので取り組みました。このアルゴリズムを実装したら閾値を…

AIXTECH（AIクロステック）

4年前

いま必要なのは笑い、そして笑いをデザインする人工知能だ

　家にいるしかないという閉塞感がたちこめているときに「自分にできることはなんだろうか」と考えた人は多いのではないだろうか。私はいまだからこそ笑いが必要だと思う。…

AIXTECH（AIクロステック）

4年前

AIXTECH（AIクロステック）

2024年2月19日 14:51

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization

画像に色のヒントを与えて着色するための拡散モデルです。

どんなもの？: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。

先行研究と比べてどこがすごい？: 複数の条件（テキストプロ

もっとみる

AIXTECH（AIクロステック）

2024年2月7日 13:15

特別号「構成画像検索（Composed Image Retrieval）」

はじめに: 構成画像検索とは構成画像検索とは、画像とクエリ（テキスト）を使って画像を検索することです。例えば、魚の画像と「折り紙」というワードで画像を検索すれば入力した魚に近い折り紙の画像を検索できます。
従来のよくある全部の画像の埋め込みベクトルを事前に計算しコサイン類似度で画像検索するというやり方だと、入力画像との類似画像しか検索できないという問題やクエリを追加して柔軟に検索することができな

もっとみる

AIXTECH（AIクロステック）

2024年2月5日 03:51

第3号「セマンティックセグメンテーションの高精度化」

Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません。

先行研究と比べてどこがすごいか: 既存の手

もっとみる

AIXTECH（AIクロステック）

2024年1月23日 06:15

第２号「画像編集と動画生成」

Edit One for All: Interactive Batch Image Editingどんなもの

課題：今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。このような手法を多くの画像に適用するにはどうすれば効率的かということについての課題をこの論文では議論しています。

先行研究と比べてどこがすごい？

新規性: 従来の研究が単一画像の編

もっとみる

AIXTECH（AIクロステック）

2024年1月18日 05:19

はじめのご挨拶

コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそちらから紹介することもあるかと思います。詳細についてはピックアップする記事は少なくとも5~8本は選びたいので、その量から全て把握するのは難しいため、概要を把握するのに論文一つにかける時間を多くは避けません。私はまだまだ精進する身にある

もっとみる

AIXTECH（AIクロステック）

2022年8月10日 15:52

写真の解像度を上げるTecoGAN

この記事では写真を高解像度にするTecoGANを紹介します。
写真を撮ったけれど画質が微妙で、もっと綺麗にしたいという時に使うと良いかもしれません。人以外にも風景や生き物など様々な画像に対応しています。自然な変換なのも特徴の一つでしょう。

推論方法TecoGANを動かす環境をローカルで構築しても良いのですが、簡単に実行するためにGoogle Colaboratoryを使用しました。（colabの

もっとみる

AIXTECH（AIクロステック）

2021年7月1日 06:05

亀裂検出モデルの損失関数を工夫した新しいアプローチ

Fast and Accurate Road Crack Detection Based on Adaptive Cost-Sensitive Loss Function

はじめに亀裂検出は事故につながりかねない道路の状況認識のためには重要な問題です。例えば、道路に大きな穴が開くようなことを未然に防ぐこともできるかもしれません。

この研究では、アーキテクチャーを工夫するような多くの研究とは異な

もっとみる

AIXTECH（AIクロステック）

2021年2月4日 22:18

物体の形状を分析するアルゴリズム TDA（TopologicalDataAnalysis）フレームワークを調査

　検索して使いやすそうなTDAのフレームワークをまとめました。Pythonも良いものが多いですが、Juliaが特に可視化が綺麗で使ってみようと思いました。Dyonysusは使ったことがあるのですが、他はまだ試したことがないのでコメントできませんでした。

PythonDionysus 2
scikit-tda
giotto-tda

JuliaTDA.jl
Sparips.jl
HomotopyC

もっとみる

AIXTECH（AIクロステック）

2021年2月1日 02:02

畳み込み演算についてのメモ書き

　畳み込み演算が分からず論文から新しいニューラルネットワークモデルを実装できずにいたら個人的に師匠だと思っている方から以下の論文を教えてもらいました。この論文の公式をTensorflowで確かめてみました。

　検証コードは以下にあります。これで畳み込み演算は少し慣れた気がします。精進！精進！

___________________________________________________

もっとみる

AIXTECH（AIクロステック）

2021年1月31日 09:26

壊れてしまった枠をもとに戻す

　線と線をつないで閉じた線にしたいときに使えます。原理としては線を全方向に広げて、線と線をつなげて元の大きさに戻すという処理をしています。画像をパディングしている理由は一度画像の端が黒になってしまった場合、縮小してももとに戻せないからです。
　この説明では具体的なイメージを掴みづらいと思うので以下のColabでコードを確認してください。

　具体的な使用シーンはGANなどで生成した物体の線が切れて

もっとみる

AIXTECH（AIクロステック）

2021年1月29日 10:05

fastaiのチュートリアルをGoogle Colabで動かす

　この記事では、Jeremy Howard氏が率いる会社「fast.ai」が開発しているディープラーニングのライブラリ「fastai」の猫と犬を認識するチュートリアルを「Google Colab」で動かします。

インストール　Google ColabとはPythonの環境をローカルにインストールせずとも使えるサービスです。Googleアカウントでログインして使いましょう。

　起動ができたらまず

もっとみる

AIXTECH（AIクロステック）

2020年11月30日 04:10

実行して理解する、早わかりKubernetes

　「Kubernetes（k8s）」は「コンテナ」を本番環境に使っている日本企業全体のうち、約50％以上が使用しているというデータがあります。（IDC Japan 2020）　それだけk8sが注目されているということでしょう。この記事では今注目のk8sを動かしながら理解するのが目的です。最後まで記事を読みながら動かすとk8sについての理解が少し深まるかもしれません。

「コンテナ」を管理するソフト

もっとみる

AIXTECH（AIクロステック）

2020年7月21日 14:06

「AIサービス」を作るときのガイドラインを産総研が発表

　機械学習を使った「AIサービス」を作るときに参照するべきガイドラインを産総研が2020年6月30日に発表しました。

　AIサービスを作るとき、機械学習のモデルには少なくとも学習データとテストデータが必要です。このとき、モデルを一度作ったら終わりではなく学習したモデルに新しいデータを加えて再度学習する「追加学習」のプロセスを考える必要もあります。

　今回発表されたガイドラインを読むと、たとえば

もっとみる

AIXTECH（AIクロステック）

2020年4月25日 21:54

異常検知アルゴリズムを実装

ChangeFinderアルゴリズムを実装しました。
GitHubにはすでに公開されていますが、自分でも実装してみたかったので取り組みました。

このアルゴリズムを実装したら閾値を決めるだけで変化点検知ができます。

ソースコードは以下のcolabにあります。

Gistにも
https://gist.github.com/Ooshita/a9d46f846de73c859668c02906836

もっとみる

AIXTECH（AIクロステック）

2020年4月12日 13:32

いま必要なのは笑い、そして笑いをデザインする人工知能だ

　家にいるしかないという閉塞感がたちこめているときに「自分にできることはなんだろうか」と考えた人は多いのではないだろうか。私はいまだからこそ笑いが必要だと思う。行動することもできないのなら、笑うことしか人間にはできない。

　誰かを批判するのではなく笑って過ごして、また誰かと一緒に笑える、そんな日を目指そうではないか。

　前置きはここまでとして、本記事では「笑いと人工知能」についてとりあげる。

もっとみる

AIXTECH（AIクロステック）

AIXTECH（AIクロステック）

週刊コンピュータービジョン

深掘り！コンピュータビジョン！

AI TIPS

第4号「コンピュータビジョンの深層学習ベース化」

特別号「構成画像検索（Composed Image Retrieval）」

第3号「セマンティックセグメンテーションの高精度化」

第２号「画像編集と動画生成」

第1号「画像生成と3D物体生成」

写真の解像度を上げるTecoGAN

亀裂検出モデルの損失関数を工夫した新しいアプローチ

物体の形状を分析するアルゴリズム TDA（TopologicalDataAnalysis）フレームワークを調査

畳み込み演算についてのメモ書き

壊れてしまった枠をもとに戻す

fastaiのチュートリアルをGoogle Colabで動かす

実行して理解する、早わかりKubernetes

おすすめのAIの学び方

「AIサービス」を作るときのガイドラインを産総研が発表

異常検知アルゴリズムを実装

いま必要なのは笑い、そして笑いをデザインする人工知能だ

第4号「コンピュータビジョンの深層学習ベース化」

特別号「構成画像検索（Composed Image Retrieval）」

第3号「セマンティックセグメンテーションの高精度化」

第２号「画像編集と動画生成」

第1号「画像生成と3D物体生成」

写真の解像度を上げるTecoGAN

亀裂検出モデルの損失関数を工夫した新しいアプローチ

物体の形状を分析するアルゴリズム TDA（TopologicalDataAnalysis）フレームワークを調査

畳み込み演算についてのメモ書き

壊れてしまった枠をもとに戻す

fastaiのチュートリアルをGoogle Colabで動かす

実行して理解する、早わかりKubernetes

おすすめのAIの学び方

「AIサービス」を作るときのガイドラインを産総研が発表

異常検知アルゴリズムを実装

いま必要なのは笑い、そして笑いをデザインする人工知能だ

週刊コンピュータービジョン

深掘り！コンピュータビジョン！

AI TIPS

記事一覧

第4号「コンピュータビジョンの深層学習ベース化」

特別号「構成画像検索（Composed Image Retrieval）」

第3号「セマンティックセグメンテーションの高精度化」

第２号「画像編集と動画生成」

第1号 「画像生成と3D物体生成」

写真の解像度を上げるTecoGAN

亀裂検出モデルの損失関数を工夫した新しいアプローチ

物体の形状を分析するアルゴリズム TDA（TopologicalDataAnalysis）フレームワークを調査

畳み込み演算についてのメモ書き

壊れてしまった枠をもとに戻す

fastaiのチュートリアルをGoogle Colabで動かす

実行して理解する、早わかりKubernetes

おすすめのAIの学び方

「AIサービス」を作るときのガイドラインを産総研が発表

異常検知アルゴリズムを実装

いま必要なのは笑い、そして笑いをデザインする人工知能だ

第1号「画像生成と3D物体生成」