ひら@包丁とキーボードとペンタプ

EBILABのデータサイエンティスト兼料理人兼漫画家 データを使って全ての料理人が幸せ…

ひら@包丁とキーボードとペンタプ

EBILABのデータサイエンティスト兼料理人兼漫画家 データを使って全ての料理人が幸せに人生を送れますように 93年生まれ ブログ→http://hirayuki.com http://kaggle.com/hirayukis 発言は全て個人の見解です

マガジン

記事一覧

分析は目的ありき

分析は目的ありきです。 「なんとなくデータを見て何か見つけられないか」という作業も「何か」をぼんやりと意識しています。 今回のお話では期末テストで平均80点以上…

なぜ分析するのか?第1話

データ分析をする以上は目的があります。 なんとなくデータを集めるのではなく、なんとなくデータを見るのではなく 仮説を確認したい・効果を数字で確認したいなど何か…

テレワークで使える背景を探してみる

エヴァンゲリオンゼーレになれます D3PTHE・テレワーク ソフマップ(これでいく勇気はまだない) その他参考まとめ記事

飲食店のtwitter活用をはじめた話

全ての料理人に(自分含む)幸せな人生を。 飲食のITカクメイ「ひら」です。 今回はお店のSNSアカウント、twitterの活用を始めた話をします。 twitterアカウントって何…

料理人になりたくて東京から三重県に引っ越したエンジニアの話

東京で働いていたある日、だんだんと仕事が楽しくなくなってきました。 このままやっていけると思うし、成長もしているし、若干息苦しさはあるものの暮らしはとても楽しい…

東京から三重県に引っ越しました

東京から三重県に引っ越しました。 生まれは富山県、そこから北海道に大学から7年間、東京に1年半、三重県で1ヶ月経ちます。 まずは東京から三重に引っ越してよかった…

効果検証入門感想その3〜重回帰〜

前回は単回帰のお話をしました。 分析したい時に単回帰を使うととても簡単に何でも表現できます。 前回に引き続き例を上げますが 身長を体重から 成績を勉強時間から …

効果検証入門感想その2〜回帰〜

効果検証入門の第2章の感想を描き始めました。 今回はみなさんに回帰が何か伝われば嬉しく思います。 前回はRCT(randomized controlled trial)について話しました。簡…

「効果検証入門」〜セレクションバイアスとRCT〜感想

交換検証入門がtwitterで話題になっていたので手に取ってみました。 こう見えても理系出身の私、ある程度は理解できるだろうと思って臨みましたが半分は理解できたのかで…

ラグ特徴量で時系列データの精度をあげる

ラグ特徴量とは何か?ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。 …

「ITってどうやって覚えたらいいの?」という友達の質問に困る

俺「何になりたいの?」 同期「そういうのじゃなくて何となく色々知っておきたい」 俺「・・・・あぁ!?(怒)」 ITってどう学べばいいの?今の時代システムは理解し…

俺はただLightGBMを動かしてみたかったんだ

ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しなが…

kaggle初心者の2ステップ目【ieee】

こいつを読んでディープラーニングを完全に理解した私ですが、やはり実践の場に出ると何も役に立ちません。アンサンブルってどうやるんだ???データ拡張ってこれで合っ…

なんでデータサイエンティストやってるの?(なんD)に行ってきた、これからデータサイエンティストになりたい人の感想

先日こちらの勉強会に行ってきました。 小副川 健さん、吉田さん(@yutatatatata)、マスクドアナライズさん(@maskedanl)、u++さん(@upura0)、樫田さん(@hik0107)の…

速くなりたい!タイピング|しろくまエンジニア

タイピングって大人になってから直そうとしても癖がついてるし、そのせいで速くならないし、なかなか難しいです。 まだまだ新入社員の私、会社の先輩方に相談してみまし…

クソコード|しろくまエンジニア

この間コードレビュー会に参加して絶望しました。 どれだけ気をつけてもどれだけ反省しても、気がついたら汚いコードを書いてしまいます。 リーダブルコードをまた読も…

分析は目的ありき

分析は目的ありき



分析は目的ありきです。

「なんとなくデータを見て何か見つけられないか」という作業も「何か」をぼんやりと意識しています。

今回のお話では期末テストで平均80点以上を採るということが目標です。さらにできる限り勉強はしたくありません。この状況下では最低限必要な勉強量を正しく測定する必要があるので、如何にそれを正確に算出するかも重要となってきます。

あの線がちょっとでも急な傾きになると勉強時間は

もっとみる
なぜ分析するのか?第1話

なぜ分析するのか?第1話



データ分析をする以上は目的があります。

なんとなくデータを集めるのではなく、なんとなくデータを見るのではなく

仮説を確認したい・効果を数字で確認したいなど何かの目的があって初めて分析が進みます

そんなお話をわかりやすく漫画にしていきたいと思います

ただ、データを適当に集めまくってマシンの暴力で「えいやっ」とやってしまう分析も面白いな私は考えています。

今回の漫画にはそのテーマは盛り込

もっとみる
テレワークで使える背景を探してみる

テレワークで使える背景を探してみる



エヴァンゲリオンゼーレになれます

D3PTHE・テレワーク

ソフマップ(これでいく勇気はまだない)

その他参考まとめ記事

飲食店のtwitter活用をはじめた話

飲食店のtwitter活用をはじめた話

全ての料理人に(自分含む)幸せな人生を。

飲食のITカクメイ「ひら」です。

今回はお店のSNSアカウント、twitterの活用を始めた話をします。

twitterアカウントって何に使ったらいいのだろうか???最初twitterをどうやって使うか非常に悩みました。

パターン1

楽しそうなアカウントにする

店員の日常、バイトの若い子が盛り上がって楽しくしている写真などを載せる。そうすること

もっとみる

料理人になりたくて東京から三重県に引っ越したエンジニアの話

東京で働いていたある日、だんだんと仕事が楽しくなくなってきました。

このままやっていけると思うし、成長もしているし、若干息苦しさはあるものの暮らしはとても楽しいものでした。

家賃は高いけれども、物価が高いなんてのは嘘でした。競争の激しい東京はサービスも良いしスーパーのお買い物も安く済みます。電車が嫌すぎて会社まで45分歩いていたので、満員電車も乗っていません。

特に不自由もなく妻と2人で暮ら

もっとみる
東京から三重県に引っ越しました

東京から三重県に引っ越しました



東京から三重県に引っ越しました。

生まれは富山県、そこから北海道に大学から7年間、東京に1年半、三重県で1ヶ月経ちます。

まずは東京から三重に引っ越してよかったなーと思います。

自分の時間を取り戻せた感じがしますし、みんな僕にぴったりの緊張感で毎日働いています。

北海道にいた頃の先輩が言っていました。「東京はみんな殺伐としている」と。そんなものは当然会社に依存すると思いますが、僕も東京

もっとみる
効果検証入門感想その3〜重回帰〜

効果検証入門感想その3〜重回帰〜

前回は単回帰のお話をしました。

分析したい時に単回帰を使うととても簡単に何でも表現できます。

前回に引き続き例を上げますが

身長を体重から

成績を勉強時間から

餌の小魚の量から、漁獲できるマグロの量を

と、線を引いて表現することが可能です。

でも実際世の中こんなに簡単ではありません。。。。

そう、マグロの漁獲量1つとっても、天候・季節・時間帯・沖からの距離・水温・地域性・わずかなポ

もっとみる
効果検証入門感想その2〜回帰〜

効果検証入門感想その2〜回帰〜

効果検証入門の第2章の感想を描き始めました。

今回はみなさんに回帰が何か伝われば嬉しく思います。

前回はRCT(randomized controlled trial)について話しました。簡潔に言うと、「検証や分析においてサンプルがランダムに選ばれていると言うことは非常に重要である。作為的にサンプルを採取していると正しい効果が検証できず、バイアスが掛かった過剰・不足のある結果が得られてしまう。

もっとみる
「効果検証入門」〜セレクションバイアスとRCT〜感想

「効果検証入門」〜セレクションバイアスとRCT〜感想

交換検証入門がtwitterで話題になっていたので手に取ってみました。

こう見えても理系出身の私、ある程度は理解できるだろうと思って臨みましたが半分は理解できたのかできなかったのか...

記録程度ではありますが、理解したことをメモに残していきます。

効果検証とは?例えばECサイト運用担当者が、顧客に販促メールを送ったとして、

メールによってどのくらいお客様の購買にどのくらい影響を与えたのか

もっとみる
ラグ特徴量で時系列データの精度をあげる

ラグ特徴量で時系列データの精度をあげる



ラグ特徴量とは何か?ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。

過去と明言しましたが、未来のデータを使うケースもたまにあります。

しかし、実際には未来のデータを利用するとリークを起こすことがあり、時系列が重視される予測モデルでは過去のデータのみに限定した方が良さそうだというのが私の見解です。

もっとみる
「ITってどうやって覚えたらいいの?」という友達の質問に困る

「ITってどうやって覚えたらいいの?」という友達の質問に困る



俺「何になりたいの?」

同期「そういうのじゃなくて何となく色々知っておきたい」

俺「・・・・あぁ!?(怒)」

ITってどう学べばいいの?今の時代システムは理解しておいた方がいいとは思いますよね。

僕も最初エンジニアを目指した時は3年程度頑張ってみて、そこから進路を決めようと思っていたので、気持ちはよくわかります。

ただこれについては答えはないと思います。

何がしたいの?何になりたい

もっとみる
俺はただLightGBMを動かしてみたかったんだ

俺はただLightGBMを動かしてみたかったんだ



ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しながらも理解できました。

しかし!kaggleで活躍したい!業務に活かしたい!機械学習もっとやってみたい!そこにたどり着くにはこの本を読んだだけでは当然ダメなのです。

とりあえずLightGBM動かしたい詳しい方は突っ込み

もっとみる
kaggle初心者の2ステップ目【ieee】

kaggle初心者の2ステップ目【ieee】



こいつを読んでディープラーニングを完全に理解した私ですが、やはり実践の場に出ると何も役に立ちません。アンサンブルってどうやるんだ???データ拡張ってこれで合ってるのか???もはやReLU関数がどうこうではありません。

恐るべしkaggle...

人のカーネルを参考にして提出するところまではu++先生の記事を読んでやってみました。

ただしせっかちな私は拾い読み。当然画像認識制度を向上させる

もっとみる
なんでデータサイエンティストやってるの?(なんD)に行ってきた、これからデータサイエンティストになりたい人の感想

なんでデータサイエンティストやってるの?(なんD)に行ってきた、これからデータサイエンティストになりたい人の感想

先日こちらの勉強会に行ってきました。

小副川 健さん、吉田さん(@yutatatatata)、マスクドアナライズさん(@maskedanl)、u++さん(@upura0)、樫田さん(@hik0107)の超豪華メンバーですっ!!

圧倒的つよつよデータサイエンティストのみなさんが登壇されて、ひよっひよデータサイエンティストの私は圧巻でした。

感想を言うにも尊敬と驚きが強すぎて、勉強会に行ったらど

もっとみる
速くなりたい!タイピング|しろくまエンジニア

速くなりたい!タイピング|しろくまエンジニア



タイピングって大人になってから直そうとしても癖がついてるし、そのせいで速くならないし、なかなか難しいです。

まだまだ新入社員の私、会社の先輩方に相談してみました。

みんな色んなアドバイスくれました。

・癖なんて気にしなくていいよ、意外とみんなあるから

・遅い原因が癖とは限らないし

・そもそもチャットレベルで打てるなら、そこまで速く打つ必要ってないんじゃない

みんなとっても優しいです

もっとみる
クソコード|しろくまエンジニア

クソコード|しろくまエンジニア



この間コードレビュー会に参加して絶望しました。

どれだけ気をつけてもどれだけ反省しても、気がついたら汚いコードを書いてしまいます。

リーダブルコードをまた読もうと思います。