コグラフ株式会社 データアナリティクス事業部

コグラフ株式会社 データアナリティクス事業部(cograph_data) データアナリ…

コグラフ株式会社 データアナリティクス事業部

コグラフ株式会社 データアナリティクス事業部(cograph_data) データアナリスト募集中!未経験OK!詳しくは記事下部にあるWantedly、Twitterリンクから

マガジン

最近の記事

『10年戦えるデータ分析入門』を読んで

こんにちは、コグラフデータアナリティクス(DAD)事業部のNです。 最近は業務で自らSQLを使ってクエリを書く機会が増えたので、業務上の必要性から『10年戦えるデータ分析入門』という本書を手に取りました。 今回はこちらの概要と、実務で活用できそうなクエリの一例を紹介します。 この本の著者について本書の著者の青木峰郎(あおきみねろう)さんは、クックパッド在籍中に分析サービスを開発し、Treasure Data在籍中にCDPの開発を手掛けるなど、現在も活躍中のプログラマーです。

    • 【BigQuery】配列の展開でハマった話

      こんにちは。データアナリティクス事業部です。 今回は、配列構造のテーブルからデータ抽出した際に少し詰まったことがあるので、その話についてご紹介させていただきます。 UNNESTと空配列について以下のようなテーブルがあるとします。 どちらも同じテーブルのように見えますが、table_Aとtable_Bのitemsを以下のようにUNNESTすると、、、 SELECT id, itemFROM table_A -- またはtable_BCROSS JOIN UNNEST(

      • PythonとJavaScriptの対比

        こんにちは、コグラフ株式会社のH.Mです。 このノートは、PythonとJavaScriptの基本的な構文や用途を比較し、どちらを学ぶべきか迷っている人に向けて作成しています。 1. 言語の概要 Python 1991年にGuido van Rossumによって開発された汎用プログラミング言語です。 初学者にも親しみやすいシンプルで読みやすい文法が特徴です。 データ解析、AI、Web開発、自動化スクリプトなど、多岐にわたる用途で使用されています。 JavaScri

        • GIT&GITHUBについて

          こんにちは。SSD-2事業部のG・Nです。 私は初心者エンジニアです。 今回は、エンジニアがよく使用するツールであるGitとGitHubについて説明したいと思います。 バージョン管理システム(VCS)とは?プロジェクトやファイルの変更履歴を記録し、複数の人が同時に作業する際に変更を調整するためのツールです。 Gitとは?Gitは開発者がソフトウェアのソースコードやファイルの変更を追跡し、効果的に管理するためのソフトウェアです。 Githubとは?GitHubは、開発者が

        マガジン

        • Pythonで統計学を学ぶ
          1本
        • SQLまとめ
          2本
        • Tableau記事まとめ
          3本
        • データ分析ロードマップ
          4本

        記事

          Windowsで始めるReact入門ガイド

          こんにちは。コグラフSSD−2事業部のSYです。 現在フロントエンジニアを目指してReactの勉強中です。そんな私がこれからReactを学び始めたいという方に向けて、Windows環境でReactを始めるための基本的なセットアップ手順を紹介します。 はじめにReactは、Facebookが開発したJavaScriptライブラリで、ウェブブラウザで複雑なUIを容易に生成することができます。つまりJavaScript単体だと記述が大変なウェブページもReactを使えば簡単に記述

          並列処理入門 Pythonでの大規模データの爆速処理をDaskではじめよう

          こんにちは。コグラフ株式会社データアナリティクス事業部のワダです。 データ分析関連の業務で多くの人が遭遇するのが「大きなサイズのデータをどう処理するか」問題だと思います。Pythonのデータ分析用ライブラリであるPandasは便利ではありますが、大きなデータになると処理が遅い、挙句にはメモリ不足でクラッシュしてしまう等の状況に出くわします。 今回はそんなビッグデータを扱う上で便利な手法である「並列処理」「平行処理」の概要とその具体的な実装についてご紹介します。今回はテーブル

          並列処理入門 Pythonでの大規模データの爆速処理をDaskではじめよう

          AWSのデータ保存プロセスをTerraformで実行するメリットと実装方法

          こんにちは。コグラフデータアナリティクス事業部です。 今回はAWSとTerraformを用いたデータ処理プロセスの構築について、AWSやTerraformに興味のある初心者に向けてメリットと実装方法をご紹介します。 Terraformでインフラ構築するメリットTerraformの概要 Terraformは、インフラの構築作業を、手動ではなくコードで実行するためのツールです。 人間が手動で作業すると、ミスしたり、属人化してしまって他の人が作業を再現できないなどの問題が起

          AWSのデータ保存プロセスをTerraformで実行するメリットと実装方法

          PostgreSQLを使用して気付いたRDMBSの違いについて

          こんにちは。コグラフ株式会社 ソフトウェアサービス事業部(SSD)のASです。 この記事では、SQLコマンドのPostgreSQLにおける違いについて紹介します。データアナリストとして活動する方々は、これらのツールに精通している必要があります。私もデータアナリストを目指してトレーニング中であり、主にPostgreSQLを使用しており、特にA5 mkソフトウェアを利用してSQLの学習を行っています。SQLの問題を解く過程で、SQLとPostgreSQLで使用されるコマンドの違

          PostgreSQLを使用して気付いたRDMBSの違いについて

          ORDER BYとGROUP BYの違いについて

          こんにちは。コグラフ株式のM.Sです。 SQLの ORDER BYと GROUP BY の違いについて解説します。 ORDER BYの基本構文 指定したカラムを昇順、降順に並び替えるときに使用します。 class_tableというテーブルがあるとします。 SELECT * FROM class_table ORDER BY height ; この例で、クラスのデータを身長順に並び替えることを考えます。 SELECT * FROM class_table ORDER

          基本情報技術者試験 外国人受験者のための攻略法

          みなさんこんにちは。コグラフ株式会社 ソフトウェアサービス事業部のムギンです。 さて先日、基本情報技術者試験を受けてきまして無事に合格しました◎ 今回は、私の受験経験をもとに、外国人受験者のための攻略法をご紹介したいと思います。 まずは結果から。 科目A:630点/1000点 科目B:615点/1000点 でした! 若干危なかったですが、合格できて良かったです。勝てば官軍!(笑) 私の受験経験初めて基本情報技術者試験に挑戦しようと考えたとき、ネットで検索すると、試験の

          基本情報技術者試験 外国人受験者のための攻略法

          率の平均を求めてはいけない - 算術平均と調和平均 -

          こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 この記事では平均の計算で注意するべきことをお伝えします。それは、率の算術平均を求めてはいけないということです。 間違っている計算方法利益率の計算を例に説明します。利益率とは利益を売上で割った値だとします。例えば利益が25で、売上が100であれば、利益率は0.25です。 東京、名古屋、大阪に支店がある会社全体の利益率を以下のような計算で求めていませんか。 このような計算は間違っています。AVERAGE関数

          率の平均を求めてはいけない - 算術平均と調和平均 -

          IT業界未経験だった私がITパスポートに1か月で合格した方法

          こんにちは。コグラフ株式会社 ソフトウェアサービス事業部(SSD)のトリです。 今回は、今年の3月までIT業界未経験だった私がITパスポートを受験するに至った理由と、1か月で合格ラインを120点上回って合格することができた勉強法についてご紹介したいと思います。 IT業界に興味がある方、IT知識の体系的な学習方法を模索している方の一助になれば幸いです。 なぜITパスポートなの?参考書を1周し終えたとき「これ、知らないまま会社員しているのは非常にマズイくない…?」と感じまし

          IT業界未経験だった私がITパスポートに1か月で合格した方法

          Vim初心者が初めに知っておきたいコマンド集

          こんにちは。SSD-2事業部のM・Oです。 超初心者エンジニアです。 今回はvimコマンドの中でも、まず初めに覚えておきたいものを厳選してまとめました。 vimとはvim(ヴィム)は、viというテキストエディタの拡張版です。 ざっくり説明すると、プログラムを書いたり文章を編集するときに便利な、コンピュータで使う「ノート」のようなものです。 特徴としては、キーボード操作のみで文字を書くことにあります。 記事の目的vimのコマンドはGoogleなどで検索すればすぐに一覧が表示

          Vim初心者が初めに知っておきたいコマンド集

          LOC()とiLOC()の違いについて

          こんにちは。SSD-2事業部のT・Yです。 今回はloc()とiloc()の違いを分かりやすく自分なりにまとめてみました! 下記、目次になります。 LOC()とILOC()とは loc()とiloc()とは簡単に説明すると loc()…DataFrameの内で条件を満たした行、列を抽出することができる。 iloc()…DataFrameの内の行と列を"行番号","列番号"で抽出することができる。 2つの共通点としては「DataFrameの範囲を絞りデータを抽出する」という

          Amazon EventBridgeを理解する三つのポイント

          こんにちは。コグラフ株式会社データアナリティクス事業部のモロズミです。この記事では、Amazon EventBridgeを理解する三つのポイントについて紹介します。EventBridgeとは、AWSサービス、カスタムアプリケーション、サードパーティのアプリケーション間でのイベントの統合とルーティングを容易にするサーバレスイベントバスサービスです。 Amazon EventBridgeサービスで扱うイベントとは、AWS環境での変更などを意味します。次のリンク先の公式ドキュメン

          Amazon EventBridgeを理解する三つのポイント

          LookerのテンプレートフィルターとLiquidパラメーターについて

          こんにちは。コグラフデータアナリティクス事業部です。 今回はLookerのテンプレートフィルターとLiquidパラメーターについて、その違いと実装例をご紹介します。 テンプレートフィルターについて テンプレートフィルタは、SQLクエリのWHERE句で使用することができます。 例えば以下のような、とある商店の売り上げデータを扱うviewがあるとします。 view: sales_data { derived_table: { sql: SELECT

          LookerのテンプレートフィルターとLiquidパラメーターについて