Kevin's Data Analytics Blog

データサイエンティスト、AIエンジニアを目指す方に向けて情報発信していきます。

JavaScriptでコイントスをするプログラミング

こんにちは。今回は、Webページ上でコイントスをするプログラムをHTML/JavaScriptで作成しましたので共有します。 実装イメージ 「Flip Coin」ボタンを押すとコイントスが始まり、表か裏が表示されます。Flip Coin function flipCoin() { var result = Math.…

スクリーンセーバー的なアニメーション動画の作成|Processing

Processingについての投稿3回目です。今回は、ずっと見ていられるスクリーンセーバーのようなものを作りたいと思い、2つ実装してみました。どちらも、ぼーっと見ていられるアニメーションになっていると思います。 アニメーション 1つ目は、複数のボールが…

二項分布が正規分布に近似する様子をアニメーションにしてみた|Processing

今回も前回に続き、Processingを使ってアニメーションを作成しました。今回は、Processingについて更に理解を深めるために、クラスを使ってみました。 アニメーションイメージ ボールが50%の確率で左か右に振れながら落ちていく時、最終的な落下位置は二項…

Processingで元気玉風のデジタル動画を作成

今回は、Processingというプログラミング言語を初めて使用してみました。Processingは、Javaを単純化してグラフィック機能に特化した言語と言われています。複雑なセットアップ作業も不要であるため、プログラミング初心者でも比較的に簡単に始められます。 …

Googleデータポータル使い方

今回は、Googleデータポータルの使い方を紹介します。最近、私の職場で使用しているデータベースシステムが、オンプレミスからクラウドのGoogle BigQueryに移行したのを受けて、BIツールについても今後、Googleデータポータルが職場におけるメインの選択肢に…

確率分布の期待値・分散・母関数まとめ~連続分布~

以前の記事に続き、統計検定1級/準1級の対策として、各確率分布の期待値・分散・母関数について整理しました。 今回は、連続分布を扱いました。 離散分布のまとめについてはこちらを参照ください。 確率分布の期待値・分散・母関数まとめ~離散分布~ - Kevi…

PythonでSQLiteのデータを読み込む方法

SQL

今回は、PythonからSQLiteのデータベースにアクセスしてSQLの実行してデータを読み込む方法を紹介します。 Pythonでデータを読み込んで処理するメリットは次の点が挙げられます。 PythonのPandasライブラリでは、データを効率的に処理するための便利な機能が…

DB Browser for SQLiteにCSVファイルをインポート

SQL

DB Browser for SQLiteにCSVファイルをインポートする方法を紹介します。 SQLの書き方を勉強・実習するにあたって、一からデータベースを構築するよりも、CSVファイルをデータベースに読み込む方が簡単なのでおススメです。 CSVファイルをインポートするにあ…

DB Browser for SQLiteのセットアップ方法・使い方

SQL

今回は、DB Browser for SQLiteのセットアップ方法と使い方について紹介します。 SQLiteとは SQLiteは、以下の特徴を持ったデータベースです。 ・設定が簡単 ・フリーで使用することができる ・PC上のアプリケーションとしても動作可能(サーバの用意が不要…

[機械学習 実践]プロ野球選手の年俸を査定するAIを作成|LightGBM|Machine Learning|Python

機械学習の実践例として、プロ野球選手の成績と年俸のデータを使って、機械学習モデルの作成・予測実行してみました。イメージは以下のとおりです。 準備 Pythonの設定 プログラムはPythonを使用し、機械学習のアルゴリズムは、Kaggle等のデータ分析コンペで…

jQuery csv2tableの使い方

今回は、csv2tableというjQueryプラグインを使って、CSVファイルをWebブラウザ上で表示する方法を紹介します。 JavaScript/jQuery JavaScriptを使うと、Webページ上の表示をユーザの操作に合わせて動的に変えられます。さらに、jQueryというJavaScriptのライ…

Webページ上でCSVデータを表示・検索するHTML/JavaScript

CSVファイルから読み込んだテーブルデータをWebページ上に表示して、テーブル内の文字を検索するための、HTML/JavaScriptを紹介します。 HTMLコード 以下の処理を行います。 検索ボックスで文字列を受取る JavaScriptを実行 <html lang="en"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> </meta></meta></head></html>

確率分布の期待値・分散・母関数まとめ~離散分布~

今回は、統計検定1級/準1級の対策として、各確率分布の期待値・分散・母関数について整理しました。 1. 離散一様分布 定義 離散型の確率変数 𝑋 について、全ての事象の起こる確率が等しい分布のこと 確率関数 期待値 分散 確率母関数 積率母関数(モーメント…

Pythonでコイントスをするアプリを作ってみた|Pyinstaller

Pythonでコイントスをするアプリを作ってみましたので、画像イメージとソースコードをこちらに残します。 画面イメージ ソースコード cointoss.py #!/usr/bin/env python # coding: utf-8 import os import sys import time import random title=''' ■ ■ ■ ■…

Pythonでレトロ2Dゲームを作ってみた|Pyxel|ゲームプログラミング

PythonのPyxelというライブラリを使って、レトロゲームを作ってみました。 youtu.be おにぎりくんが爆弾を避けながらビールを獲得していくというシンプルなゲームです。※おにぎりくんは、親戚の子供向けに作成した架空のキャラクターです。 Pyxel紹介 Python…

【Python/Pandas】Webページ上のデータを読み込んで、動く棒グラフを作成する方法|AKB48 シングル選抜回数

こんにちは。今回は、Web上に公開されているAKB48歴代シングルにおける選抜メンバーの一覧表を読み込んで、メンバーごとの選抜回数の推移を集計し、動く棒グラフ(Bar Chart Race)で可視化したいと思います。 AKB48のディスコグラフィー/選抜メンバーの一覧…

【初心者向け】Pandas入門 これだけは押さえておくべき基本操作|データ分析で必須

こんにちは、今回はPythonのライブラリの1つである、Pandasについて紹介したいと思います。 Pandasとは データ分析用のライブラリで、表形式のデータを効率的に処理するための機能が多く提供されています。 実際のデータ分析作業のうち「データ前処理が8割…

データ分析者が知らないと損するLinuxコマンド5選

今回は、データ分析者にオススメのLinuxコマンドを5つ紹介したいと思います。 はじめに Linux環境 Linuxはサーバー向けのOSですが、近年は、GCPやvirtualboxなどの仮想マシン上にLinuxをインストールして使っている方も多いと思います。その中でも、簡単にLi…

Cygwinのインストール|SEを目指す方にオススメのソフトウェア

こんにちは。今回はCygwinのインストール方法ついて紹介します。 Cygwinとは インストーラのダウンロード インストール Cygwinの起動 Cygwinの動作確認 まとめ Cygwinとは Cygwinを使うと、Windows PC上にUNIX系OSの実行環境を疑似的に再現することができま…

Pythonで動く棒グラフを作成する方法|Bar Chart Race

こんにちは。時系列で動く棒グラフをYoutube等で見かけたことがあると思いますが、先日、私も作成してみました。 youtu.bePythonで簡単に作れたので、作成手順を共有したいと思います。 想定環境 1. 事前準備 1-1. Pythonのセットアップ 1-2. FFmpegのインス…

職場の同僚たちの34の資質を分析してわかったこと|ストレングスファインダー® 主成分分析

こんにちは。ストレングスファインダー®についてご存じでしょうか。私の所属する部署ではお互いメンバーのことをより深く理解するために、ストレングスファインダー®を活用しています。今回は、職場のメンバーの資質・特徴を分析したところ、面白い結果が得…

exe化したPyrhonプログラムが実行エラーになった場合の対処法|Pyinstaller FileNotFoundError

こんにちは。先日、Pythonプログラムをexeファイル化した時に、なかなかうまくいかず苦戦したので、エラーの内容と対処方法を記事に残しておきます。同様のエラーに遭遇された方の参考になれば幸いです。 exeファイルとは 拡張子が「.exe」になっている実行…

【テキストデータの分析】Word Cloudの実行ファイルを公開|頻出単語の抽出・可視化用

こんにちは。今回は、「簡単にテキストデータを分析したい」、「Word Cloudを使ってみたいけど、Pythonをインストールしてプログラム実行するのは大変だし、面倒くさい」という方向けに、実行ファイルを用意しました。この実行ファイルを使えば、Word Cloud…

【テキストデータの分析】頻出単語の抽出・可視化 Word Cloudの作成|コピペで使えるコード付き

こんにちは。今回は、テキストデータの分析をする際によく用いられるWord Cloudについて紹介します。 Word CloudのイメージWord Cloudは、文章の中に出現した単語を、その出現回数に比例した大きさにして並べたものです。文章データに含まれる情報を抽出し、…

Jupyter Notebook:データサイエンティストを目指す方にオススメのPython実行環境

こんにちは。今回は、多くのデータサイエンティストが実務で使用している、Jupyter Notebookについて紹介します。 Jupyter Notebookとは 想定環境 起動方法 Python実行用の作業フォルダ作成 ノートブックの作成 プログラムの実行 その他の基本操作 説明文の…

データサイエンティストを目指す方向け Pythonセットアップ方法(Windows版)

2021年は自分から発信をしていこうということで、ブログを始めることにしました。IT企業にて10年以上勤務してきた中で培った経験を基に、技術的なトピックについて共有していこうと思います。 第1回目は、Pythonのセットアップ方法を紹介します。Pythonは、…