くすぐったがり

データ利活用まわりでビジネスを考えてるチーフなんたらサイエンティスト

くすぐったがり

データ利活用まわりでビジネスを考えてるチーフなんたらサイエンティスト

マガジン

  • data scientist's memo

    データサイエンス関連の情報を外部記憶装置的に。 元々の執筆目的だったので整理した目次も作りますが、他のtweet的な記事なんかも書くようになったので、わかりやすくなるようにマガジンでも管理します。

  • 生成AI関連の情報まとめ

    ChatGPTとか大規模言語モデル(LLM)関連の情報、分量が多すぎるので時々調べたものを外部記憶装置的に。進歩が急すぎて目次を丁寧に作るよりマガジンに放り込む管理にしました。

  • 数学屋の憂鬱

    X/Twitter等から引越した記事をぶら下げていきます。 ちょっと数学屋的に、ちょっと雑に。昔そんなタイトルでブログしてたな…。

  • つぶやきとか雑感とか

    X/Twitter等から引越した記事をぶら下げていきます。 外部記憶装置の代用としてのマジメな情報源・記事ではないので、ちょっと雑に。

最近の記事

  • 固定された記事

仕切り直しで収集情報の整理から

だいぶ前、初回の投稿として目次案など書いていましたが、それから長いことnote執筆しないでおりました。同じようなことを勤務先で業務としてやることになったのが1番の理由です。秘密情報はないものの、業務内容を並行してnoteに書くのは、業務上の扱いとして少々ビミョウなので。 一方で、何も執筆しないのも少し違うなぁ、何を代わりに書こうか、と考えつづけながら、忙しさに流されて放置し続けてしましました。 で、代わりの内容に思い至って再開を考えた次第です。これまで参照してきたデータサイ

    • ゲーム理論やネットワーク分析に関する手法のまとめ

      自分は経済学というよりは経営工学・ORからゲーム理論に接し、必要に応じてネットワーク分析の手法を使いつつ、政治学や社会学など社会科学に共通する課題に数学的にアプローチしていた。 素晴らしい経済学の方々は尊敬するし、作られた手法は使わせて頂く。管理上または形式的に経済学の括りで語るのも否定しない。いや、自分が若い時に経済学が今の状態なら、自分も経済学を選択して、経済学だけで語るヤツに自分がなっていたのかもしれないwww 僕の学生時代は経済学もマトモに数学を使えない奴らだったから

      • マッチング理論やマーケットデザインに関する手法のまとめ

        データサイエンスというとデータを集めて分析して、という範囲でしか考えないSEの亜種としての機械学習エンジニアやBI+α程度ができるだけのコンサルタントが、結構な割合でデータサイエンティストを名乗ってる。 しかし実際は他にも多様な手法があることを本来のデータサイエンティストは知っている。もちろんデータも使うが、問題を解決するのにビジネスや業務のロジックを可能な範囲で定式化して数理最適化・線形計画法(Operations Research)やシミュレーション(システムダイナミクス

        • 生成AIのトレンド予想と具現化されてるツール

          仕事で使う情報を整理する目的もあって、大規模言語モデル(LLM)やそのツールの情報整理2024.04版から表題に使う情報を分離して別ページにしました。 1. AIエージェントは今年ウォッチしていくトレンドの1つか 先月も取り上げた完全自律型AIエンジニアDevinに関する記事も増えてきた。ただCognition社からの情報量は同じで、取り上げる人たちが増えて注目度や解像度が上がった感じ。 自己学習型AI/完全自動型AIの魅力と脅威とかコンサルタントがみんな頭が良い訳じゃ

        • 固定された記事

        仕切り直しで収集情報の整理から

        マガジン

        • data scientist's memo
          42本
        • 数学屋の憂鬱
          14本
        • 生成AI関連の情報まとめ
          21本
        • つぶやきとか雑感とか
          15本

        記事

          量子コンピュータってどうなん

          量子コンピュータという技術自体は将来的には有用だと私も思ってます。 ただ、少なくとも私が理解できている数理最適化・線形計画法(Operations Research)の分野では整数計画問題(巡回セールスマン問題やナップサック問題など)への適用が期待されていたものの、その技術の出始めのころから既存の有償ソルバーの方が早くて便利だと言われて久しかった。 そのあたりをわかりやすくバッサリ解説してるのが上記の記事、本当に助かる。 OR分野のうち数理最適化関連の研究者は、ビジネスの状

          量子コンピュータってどうなん

          人事分野のドメイン知識とデータサイエンス

          人事分野のデータサイエンスは「people analytics」として1つの分野になっていて、素材も多いので別ページに分けました。 先行事例は、やはりgoogleかな。いろいろまとまっている。 本当は人事こそデータで考えるべきだと思ってます。たまたまローテーションで人事部にいたり、他の仕事ができなくて置かれているような人による官や経験に基づく思いつきの施策は多くの社員を苦しめるから。 以前とある人事部門で、買い叩かれ案件に付き合ったこっちも悪いのだが、データ分析だけ導入す

          人事分野のドメイン知識とデータサイエンス

          ピタゴラス「世界は数でできている」 神は世界を美しく創造された、全て自然数で表現できる(分数はOK でも無理数√2を発見!神の過ちと考えた彼は弟子達に他言無用とした うっかり口を滑らせようとした弟子の乗る船は雷が落ちて沈んだとか 数学が宗教や建築、音楽とも密接に繋がっていた昔の話

          ピタゴラス「世界は数でできている」 神は世界を美しく創造された、全て自然数で表現できる(分数はOK でも無理数√2を発見!神の過ちと考えた彼は弟子達に他言無用とした うっかり口を滑らせようとした弟子の乗る船は雷が落ちて沈んだとか 数学が宗教や建築、音楽とも密接に繋がっていた昔の話

          ミクロ経済学とかゲーム理論で出てくる寡占モデルが、成程こういう形で実現してしまうのか。 確かに元地方民、現都民としては、この解釈が凄くシックリくる。 https://togetter.com/li/2338467 次からは経済とかの数理モデルを整理しておこう。

          ミクロ経済学とかゲーム理論で出てくる寡占モデルが、成程こういう形で実現してしまうのか。 確かに元地方民、現都民としては、この解釈が凄くシックリくる。 https://togetter.com/li/2338467 次からは経済とかの数理モデルを整理しておこう。

          難しい技術より最初はExcelから

          データサイエンスやらDX、AI、ITとか小難しいこと、誰も自分ではやりたくないですよね。だって目の前の業務に忙しいのに、すぐに業務に役立たなそうですもの。新しいITツールとかハードル高いし。 それなのに全社DX研修とか言って全社員にいきなりpython学ばせようとしだす人事部門がいて、、、先ず隗より始めよ、自分で一度やってみろという話です。事情を知らずに講師で行ったら、受講者から文句をつけられたけど、御社内の諸々まで知らんがな。。。 社内の動機付けや文化醸成から始めて、Ex

          難しい技術より最初はExcelから

          大規模言語モデル(LLM)やそのツールの情報整理2024.04版

          ChatGPTがアカウントなしで利用可能になり、Microsoft CopilotにはGPT-4 Turboが導入された。明に禁止する組織や業務も出てきたし、使い易さで市場を少しでも取りにいく戦略かな、そういえば日本法人もできるそうだし。 そんな攻勢を仕掛けるのはClaude 3がそれだけ脅威だからか。 個人的にはPerplexityが広告を導入予定って方が驚き。有償版だけでは収益が厳しいのか、Google対抗の新時代検索エンジン候補はgoogleのSEOモデルを取り込む

          大規模言語モデル(LLM)やそのツールの情報整理2024.04版

          LLMでデータサイエンスはどこまで変わるか

          LLMを活用することで、データ分析の作業を支援してくれたり、代替してくれたり、だいぶ楽になりそうなことは、以前の記事でも挙げました。 加えてデータ分析だけでなく、最適化問題にも手を出し始めています(以前は最適化のページに置いてました、整理してコチラに)。 こうした事例を見ると、まだ「確かにできるよね」って段階のものだったりもします。いや言い方が悪い、、、LLM自体は凄い技術進歩と思ってます、今でもたまにコーディングする時とか関数やパラメータの詳細を忘れてるのでLLMにすご

          LLMでデータサイエンスはどこまで変わるか

          こういうのは面白くて好きだなー https://togetter.com/li/1824837

          こういうのは面白くて好きだなー https://togetter.com/li/1824837

          ペーパーテストのスコアだけが全てじゃない、ペーパーテストのプレッシャーや形式が苦手な人もいるし、生育環境のおかけで点数が取れる、お勉強が得意なだけの人もいる。 でも人の優秀さを捉えるのに便利な指標の1つでしょ、と言われれば否定できない https://togetter.com/li/2257378

          ペーパーテストのスコアだけが全てじゃない、ペーパーテストのプレッシャーや形式が苦手な人もいるし、生育環境のおかけで点数が取れる、お勉強が得意なだけの人もいる。 でも人の優秀さを捉えるのに便利な指標の1つでしょ、と言われれば否定できない https://togetter.com/li/2257378

          データの量や質、評価指標などのテクニック

          lightgbmとかxgboostとかアルゴリズムいろいろ試してみるのは良いのだけど、システム開発じゃないの、ただモジュール当てれば言い訳じゃなくてねー、他にも気にすることあるの……。 というやり取り多かった某ITベンダーAI部門いたなぁー(遠い目) まずは特徴量を作るところ、そのための探索的データ分析も そもそもデータ量の多寡とか、判別問題なら不均衡とか、このあたりちゃんと考えるだけで予測性能が格段に良くなる アンサンブルにしたり問題を再定義したりテクニックいろいろ

          データの量や質、評価指標などのテクニック

          真っ直ぐさと賢さを兼ね備えたヤツは凄いし、正直に敵わない。 そういう人は、裕福な家庭環境な場合も多かったけど、理解力or器のある家族に恵まれてる印象の方が強い。どちらにせよ自分には無かったな…。 https://togetter.com/li/1578533

          真っ直ぐさと賢さを兼ね備えたヤツは凄いし、正直に敵わない。 そういう人は、裕福な家庭環境な場合も多かったけど、理解力or器のある家族に恵まれてる印象の方が強い。どちらにせよ自分には無かったな…。 https://togetter.com/li/1578533

          2番打者にバント技術に長けた選手を配置する戦術→川相は出塁でもチームに大きく貢献。リーグ年間犠打記録を更新する年の川相のOPSは.806でチーム3位。逆に出塁率を度外視してバント技術だけ長けた選手を2番に置いても得点増加に結びつかない https://president.jp/articles/-/63435?page=1

          2番打者にバント技術に長けた選手を配置する戦術→川相は出塁でもチームに大きく貢献。リーグ年間犠打記録を更新する年の川相のOPSは.806でチーム3位。逆に出塁率を度外視してバント技術だけ長けた選手を2番に置いても得点増加に結びつかない https://president.jp/articles/-/63435?page=1