投稿一覧

21-25件 / 78件

【pandas】データの代表値を求める

データの代表値をpandasで求める方法を紹介します。 計算する代表値 以下の代表値を計算します。 平均(相加平均) 中央値 最頻値 分散 標準偏差 四分位数 パーセンタイル 各代表値の説明は以下の通りです。 平均(相加平均) 全てのデータを足してデータの個数で割った値です。 $$ \begin{align} {\bar{x}} = \frac{1}{N}\sum\limits_{i}^{N}{x_{i}} \end{align} $$ 中央値 全てのデータを値の大きさの順に並べたときにちょうど中央に来る値です。データの個数が偶数であるときは中央に来る2つのデータの平均値を中央値とします。 最頻値 全てのデータの中で最も多く出てくる値です。 分散 各データが平均値から平均的にどのくらい離れた値を有しているかを、各データの平均値からの差分の2乗を平均することで評価した値です。 $$ \begin{align} s^{2} = \frac{1}{N}\sum\limits_{i}^{N}{\left(x_{i} - {\bar{x}}\right)^{2}} \end{align} $$ 標準偏差 分散の平方根をとった値です。 四分位数 全てのデータを小さい順に並べたときに、小さい方から全体の4分の1の位置に来るデータの値のことを第一四分位数、4分の2の位置に来るデータの値のことを第二四分位数、4分の3の位置に来るデータの値のことを第三四分位数といいます。第二四分位数は中央値と等しいです。 パーセンタイル 全てのデータを小さい順に並べたときに、小さい方から全体の$n$%の位置に来るデータの値のことを$n$パーセンタイルといいます。25パーセンタイル、50パーセンタイル、75パーセンタイルはそれぞれ第一、第二、第三四分位数と等しいです。 サンプルコード copy_allimport pandas as pd import numpy as np # サンプルデータを用意する data = { 'column': [3, 5, 6, 10, 6, 6, 20, 14, 1, 6] } df = pd.DataFrame(data) """ 代表値の計算 """ # 平均値 mean = df['column'].mean() # 中央値 median = df['column'].median() # 最頻値 mode = df['column'].mode() # 複数ある場合が存在するため、結果がSeriesとなる # 分散 variance = df['column'].var() # 標準偏差 std_dev = df['column'].std() # 四分位数 quartiles = df['column'].quantile([0.25, 0.5, 0.75]) # パーセンタイル(90パーセンタイルの例) percentile_90 = np.percentile(df['column'], 90) # 結果の表示 print(f"平均: {mean}") print(f"中央値: {median}") print(f"最頻値: {mode}") print(f"分散: {variance}") print(f"標準偏差: {std_dev}") print("四分位数:") print(quartiles) print(f"90パーセンタイル: {percentile_90}") 以下が実行結果です。 copy_all平均: 7.7 中央値: 6.0 最頻値: 0 6 Name: column, dtype: int64 分散: 31.34444444444445 標準偏差: 5.598610938835137 四分位数: 0.25 5.25 0.50 6.00 0.75 9.00 Name: column, dtype: float64 90パーセンタイル: 14.599999999999998

pageview 147

できることを少しずつ

今日は当サイトのサイトマップの作成(完全に失念していました)とGoogle Search Consoleへのサイトマップ登録及び当サイトのインデックス登録のリクエストを行いました。これでしばらくすれば検索エンジンに当サイトが引っかかるようになるはず…。毎日少しずつできることをやっていきます。 また、Xのアカウント(@y_iizuka_phys)を作成しました!記事の投稿のお知らせはこちらでしていきます。もしよろしければ記事を読んでみての感想等をリプライで頂けたら嬉しいです。 それでは本日はこの辺で。

pageview 142

【FastAPI覚書】FastAPIを試す

環境構築 Python3.6以上のバージョンで仮想環境を作ります。今回はバージョン3.12で仮想環境を構築することにします。 copy_all# 仮想環境を構築 uv venv -p 3.12 .venv312 # 仮想環境を有効化 .venv312\Script\activate 作成した環境にFastAPIとUvicornをインストールします。Uvicornは高速かつ軽量なASGI(Asynchronous Server Gateway Interface)サーバーであり、Pythonの非同期WebアプリケーションとWebサーバー間の通信を標準化するためのインターフェース仕様を提供します。 copy_alluv pip install fastapi uvicorn これで最低限の環境構築は完了です。 エンドポイントと処理内容の記述 現在いる階層に以下の内容でmain.pyを作成します。 copy_allfrom fastapi import FastAPI # FastAPIのインスタンスを生成する app = FastAPI() @app.get('/') # FastAPIインスタンスにエンドポイントを紐づける def index(): # エンドポイントに対する処理の内容を記述する return {'text': 'hello'} エンドポイントの紐づけと処理を定義をどのファイルのどんな名前のFastAPIインスタンスにしたかはサーバーの起動時に必要になってきます。忘れないように控えておいてください。 サーバーの起動 以下のコマンドでWebアプリケーションを起動します。 copy_alluvicorn main:app --reload --port 8000 main:appはmain.pyのappインスタンスをWebアプリケーションとして起動する、という意味になります。--reloadをつけておくことでコードに変更が加えられてもブラウザ側が自動で変更を反映してくれます。--portではWebサーバーを利用するためのポート番号を指定します。 SwaggetUIによるWebアプリケーションの実行 http://localhost:8000/docsから作成したエンドポイントの一覧が確認できます。確認するだけではなく、定義したエンドポイントに対する処理を実行することも可能です。

pageview 142

大人にも快適な子供部屋

本日の気付き 起きたらすぐに離乳食を食べさせないと、(おなかがすくことにより)子供の機嫌が悪くなって離乳食を食べてくれなくなる。 本日の読書 本 経営の教科書ー社長が押さえておくべき30の基礎科目ー | 新 将命 読んだ範囲 第5章 目標に向かってともに進める社員がいるか(170-174頁) 内容 継続的な顧客満足は社員満足を前提とする。 社員にとって次の4つは真に悲しいことである。①会社からの期待が分からない、②結果を出したが、それがどう評価されているかが分からない、③成果が評価・処遇にどう結び付くかが分からない、④将来の方向性が見えない 会社と社員がWin-Winの関係にあることが社員の幸福であることである。 会社は経営者の器を超えて大きくなることはない。器には人に任せる能力が含まれる。 「経営とは、人を通じて物事を達成する技なり。経営とは、平凡な人に非凡な仕事をさせる技なり。」 任せることのメリット:会社の成長につながる、社員のモチベーションアップ、社員のスキルアップ、社員が仕事をやり遂げたときに達成感と喜びが生まれる、etc... その他 ジョイントマットを敷いたことによって生まれた広大なスペース、諸刃の剣かもしれません。子供と一緒に横になっていたら、いつのまにか寝ていました。床からの冷気が遮断され温かく、スペースが広いので伸び伸びとできる。毛布と枕の代わりになるものがあるから、入眠しやすい。寝るための環境としてバッチリですね。というか、毛布と枕なんか置くから悪いんですよね。。

pageview 139

Linux上に構築した仮想環境をJupyterLabで動かす

準備:仮想環境の作成 JupyterLabで動かす仮想環境を作っておきます。以下では用意した仮想環境の名前を.venv313であるとし、作成した仮想環境と同じ階層にいるものとします。参考:uvコマンドの使い方 ipykernelのインストール 作成した仮想環境を有効化し、ipykernelをインストールします。 copy_all# 仮想環境を有効化する source .venv313/bin/activate # ipykernelを仮想環境にインストールする uv pip install ipykernel カーネルの作成 以下のコマンドを実行し、JupyterLab上で動かすカーネルを作成します。 copy_all# .venv313の仮想環境を有効化するカーネルを作成する # Python3.13(data_science)はJupyterLab上での表示名 python -m ipykernel --user --name .venv313 --display-name "Python3.13(data_science)" カーネルの再起動 仮想環境にパッケージを追加する等の変更を加えたりメモリのリセット(入力/出力の消去)をしたりする場合、カーネルの再起動をするとよいです。ページ上部タブの「カーネル」 > 「カーネルを再起動」から再起動ができます。 補足:カーネルの削除 不要なカーネルを削除する場合は、 copy_alljupyter kernelspec list でカーネルに対する一覧を表示して削除したいカーネルのパスを確認した後、 copy_allrm -rf <カーネルのパス> でカーネルが削除できます。

pageview 138