コグラフ株式会社 データアナリティクス事業部

コグラフ株式会社 データアナリティクス事業部(cograph_data) データアナリ…

コグラフ株式会社 データアナリティクス事業部

コグラフ株式会社 データアナリティクス事業部(cograph_data) データアナリスト募集中!未経験OK!詳しくは記事下部にあるWantedly、Twitterリンクから

マガジン

最近の記事

第二弾:Pyspark 問題集(基礎編)

こんにちは。コグラフSSD−2事業部の安山です。 データサイエンスの世界では、大規模なデータセットを扱う能力が不可欠です。その中核をなすのが、Apache SparkとそのPythonインターフェイスであるPySparkです。PySparkは、ビッグデータ処理における強力なツールであり、データ分析、機械学習、リアルタイムデータストリーミングなど、多岐にわたる用途に利用されています。 PySparkを使った具体的なデータ処理の例と解答例を示し、理解を深めることができるように設計

    • 尤度(ゆうど)

      こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 データサイエンスの勉強をしていると、尤度(ゆうど)という言葉がよく登場します。インターネットで検索するといくつも解説が出てきます。 これらを読んで尤度とは何か理解できた方はそれで大丈夫です。この記事では、理解できなかった方のためにもっとわかりやすい説明に挑戦します。 ベルヌーイ分布成功と失敗のような、二種類の値をとる現象を考えてください。ベルヌーイ分布はそのような現象を表現できる確率分布です。 $${\t

      • バタフライ効果 - 予測という行為の本質的な難しさについて -

        こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 自然現象や人間の経済活動では、初期条件のわずかな差が時間経過にしたがって無視できないほどの大きな差が生まれることがあります。この記事では運動方程式をシミュレーションして、磁石に引きよせられる振り子の軌道を描いてお見せします。振り子がまったく予測不可能な動きをする様子をお楽しみください。Pythonを使ってシミュレーションを行っています。Google Colaboratory環境で動きますので、ぜひお試しくださ

        • セットで覚える!基本のLinuxコマンド

          こんにちは、コグラフデータアナリティクス(DAD)事業部のナカムラです。 データを扱う仕事柄、Linuxに触れる機会が多いので、本日は基本的なLinuxコマンドを紹介したいと思います。 Linuxは、そのコストメリットと高い安定性から多くのサーバで活用されています。Linux操作にはコマンドを使用するので、それらを覚えておくと非常に便利です。 今回はよく使用する、ファイル・ディレクトリ操作に関する基本的な12のLinuxコマンドをピックアップしました。 コマンドは関連した

        マガジン

        マガジンをすべて見る すべて見る
        • Pythonで統計学を学ぶ
          コグラフ株式会社 データアナリティクス事業部
        • SQLまとめ
          コグラフ株式会社 データアナリティクス事業部
        • Tableau記事まとめ
          コグラフ株式会社 データアナリティクス事業部
        • データ分析ロードマップ
          コグラフ株式会社 データアナリティクス事業部

        記事

        記事をすべて見る すべて見る

          ExcelとSnowflakeを接続する(EXCELERATOR)

          こんにちは!! コグラフSSD−2事業部のルイスです。 本日、ExcelからSnowflakeにデータを取得、登録、更新する方法を紹介したいと思います。この記事に使うツールはSnowflakeやMicrosoft・Excelは必要です。 Exceleratorは、ExcelテーブルからSnowflakeのデータベースにデータを転送する際に非常に便利なツールです。このマイクロソフトのツールにアドインされた拡張機能です。ご存じない方のために、今日はそのインストール方法と使い方を

          ExcelとSnowflakeを接続する(EXCELERATOR)

          SnowflakeからAWSのS3バケットにテーブルを保存の手順

          こんにちは!! コグラフSSD−2事業部のルイスです。 本日、Snowflakeのアウトプット出力テーブルをAWSのS3バケットに保存する方法を紹介したいと思います。この方法は、Snowflakeで外部ステージを作成することです。 この手順を実行するには、SnowflakeとAWSの両方のアカウントが必要です。 S3バケットを作成最初のステップでは、ファイルを保存するため、S3バケットを作成する必要があります。S3バケットを作成するには、AWSコンソールを開いて、検索バー

          SnowflakeからAWSのS3バケットにテーブルを保存の手順

          【誰でもできる】SQLでデータを作ってみよう!

          こんにちは。コグラフSSD−2事業部のナカハマです。 「データベース?ビッグデータ?なんかかっこいい!」 最近データを扱った仕事が増えている時代になりましたね。 「データを扱う仕事ってどんな事すればいいんだろう?」 データを扱うには「SQL」というデータベース操作言語を使います。 SQLを使えばデータを扱う仕事への第一歩です! この記事では、SQLを使って実際にデータを作ってみます。 ぜひ最後までご覧ください。 1.SQLとはSQLとは、データベース言語の1つです。 読み方

          【誰でもできる】SQLでデータを作ってみよう!

          請求と支払を照合する技術 - DXの現場を支える完全外部結合の力 -

          こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 みなさんは請求と支払の照合は得意ですか。難しいと感じる方が多いのではないでしょうか。私も以前は苦手でしたが、SQLの完全外部結合について学ぶことで、この課題を克服することができました。 この記事では、完全外部結合を知っていると照合作業がとても簡単になることをご紹介します。照合は業務のあらゆるところに登場しますから、応用範囲が広い強力な武器となります。 照合作業の何が難しいのか難しい点は以下の通りです:

          請求と支払を照合する技術 - DXの現場を支える完全外部結合の力 -

          第一弾:Pyspark 問題集(基礎編)

          こんにちは。コグラフSSD−2事業部の安山です。 データサイエンスの世界では、大規模なデータセットを扱う能力が不可欠です。その中核をなすのが、Apache SparkとそのPythonインターフェイスであるPySparkです。PySparkは、ビッグデータ処理における強力なツールであり、データ分析、機械学習、リアルタイムデータストリーミングなど、多岐にわたる用途に利用されています。 PySparkを使った具体的なデータ処理の例と解答例を示し、理解を深めることができるように設計

          割り算だけじゃもったいない。ベータ分布も描いてみよう。

          こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 コインを投げて、表が7回、裏が3回出たとすると、表が出る確率は0.7と計算できますね。しかし、このように割り算で求めた確率の値だけでは、失われてしまう情報があるのです。割り算だけではなく、表が出る確率の分布を描いて、もっと豊かな情報を手に入れましょう。 この記事のコードはGoogle ColaboratoryのPythonで動きますので、ぜひお試しください。 ベータ分布とはわかりやすい言葉で説明しますと、ベ

          割り算だけじゃもったいない。ベータ分布も描いてみよう。

          SQLを計画ツールとして使う

          こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 この記事では、倉庫から工場までの商品配送スケジュールを計画するツールとしてSQLを使う方法を説明します。祝日がからんだり、関係者が増えるとスケジュール作成はどんどん大変になっていきますが、それを自動化することができます。 稼働日テーブルを作成する2/8(木)から2/14(水)までの一週間を考えます。倉庫の休みは2/10(土)、2/11(日)です。工場の休みは2/11(日)です。休みを除いた稼働日だけのテーブ

          【初学者向け】データベースの世界へようこそ:SQL

          こんにちは。コグラフSSD−2事業部の西田です。 データベースは情報を整理し、効果的に管理するための強力なツールであり、その中核をなすのがSQL(Structured Query Language)です。SQLを理解することで、データベース上でのデータの操作や取得が容易になります。この記事では、データベースの基本的な概念から始め、SQLの基礎を探っていきましょう。 1. データベースとは売上情報などの様々なデータを格納している場所です。一般的な形式のリレーショナルデータベー

          【初学者向け】データベースの世界へようこそ:SQL

          SQLをすばやく解読できるかも - PythonからGraphvizを手軽に使ってみましょう -

          こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 Graphvizは点と点がどのようにつながっているか、構造を記述するだけで自動的にグラフ(頂点と辺からなるネットワーク図)を作成してくれるツールです。 この記事では、PythonからGraphvizを使う方法を簡単に説明します。そして、SQLの構造を把握するツールとしての使い方を紹介します。Google Colaboratoryを使って説明しますので、環境構築は不要です。 簡単な使い方Google Cola

          SQLをすばやく解読できるかも - PythonからGraphvizを手軽に使ってみましょう -

          入社する前に知りたかったLinux の基本知識!

          こんにちは。コグラフSSD−2事業部の斉藤です。 本日の記事は私が未経験エンジニアとして案件先に配属さえる前に知っておきたかった知識を皆さんと共有できたら思います。入社する前にこれだけは知っていたら業務で役に立つ知識をご紹介します。 そもそも Linuxとは何なのか? そもそもLinux とはなのですが、Operating System の一つに分類されます。例えば、Mac ユーザーならMacOS使ってたり、Windowsユーザーなら Windows 10 などがOSにあ

          入社する前に知りたかったLinux の基本知識!

          Snowflake環境でPythonを接続する

          こんにちは。コグラフSSD−2事業部のルイスです。 前回、Snowflakeとローカルのpythonを接続する方法を紹介しました。もし、Snowflakeの中で直接Pythonが使えると言ったらどうなるでしょうか?今日は、Snowflakeの中のPythonワークシートについて紹介します。 Pythonワークシートはどんなツール?ということでコネクターを作成でなく、直接Snowflake上にSnowpark・Pythonを利用することができます。 nowflake機能でPy

          Snowflake用Snowpark・Python

          こんにちは。コグラフSSD−2事業部のルイスです。 Snowflakeはクラウドベースのデータウェアハウスで、データサイエンティスト、エンジニア、アナリストの間で非常に人気です。 Snowparkは、開発者が好みの言語(Python、Scala、Java)でコードを書き、そのコードをSnowflake上で直接実行できるようにする、Snowflakeの新しい開発者エクスペリエンスです。 この記事では、Pythonを使ってSnowflake Snowparkに接続する方法を紹介