Yyatmita

Nori & Cloco ・ Data Expedition

データ探検— Titanic 編

データ分析の入門書を、1ページ目で閉じたことのある人へ。

のり子と AI クロコが、タイタニックの乗客名簿 891 人 を pandas で読み解く 121 ページのマンガ。Σ も σ も出てきません。 読み終えるころには、あなたも pd.read_csv() を打ちたくなっている。

『ノリとクロコのデータ探検 — Titanic 編』の表紙(のり子とクロコ)

Peek inside

数式じゃなく、マンガのコマで分かる。

「運賃は平均が中央値の2倍以上。金持ち席が平均を持ち上げてる」—— 言葉にすると難しい“平均値の弱点”が、のり子とクロコのやりとりだと、すっと入ってくる。

本編の一場面。のり子とクロコが、運賃の平均32.20と中央値14.45のズレを画面のグラフを見ながら話すページ
第2章より「平均と中央値のズレ」本編マンガ

Hands on

読むだけで、終わらない。

本に出てくるデータは、あなたの手元でも同じものが動きます。Google Colab に この4行を貼って Shift + Enter。インストールも、お金も要りません。

import pandas as pd

URL = 'https://raw.githubusercontent.com/.../titanic.csv'
df = pd.read_csv(URL)
df.head()

——タイタニック号の乗客名簿、最初の5行が表で出れば成功。あなたは今、データ分析を始めました。

The expedition route

全 5 つの寄港地と、ひとつの終着

  1. 01乗船pandas で名簿を開くread_csv・head・describe。表計算ソフトの“あの感じ”が、たった3行で動き出す。
  2. 02記述統計平均が、嘘をつくとき平均運賃と中央値が2倍以上ちがう理由を、ピザの分け方で腑に落とす。
  3. 03クロス集計性別で切ると景色が変わる全体の生存率は38.4%。でも女性74.2%・男性18.9%——約4倍の差が現れる。
  4. 04可視化グラフの選び方棒・ヒストグラム・箱ひげ・ヒートマップ。「何を見せたいか」で道具が決まる。
  5. 05機械学習ロジスティック回帰生存確率を弾き出す“採点表”。係数を、はじめて自分の言葉で読めるようになる。
  6. 終着そして891 行は、891 人だったデータは集団を語る道具。その便利さの裏で、網目をすり抜けた人がいる。

The heart of this book

     survived  pclass     sex   age
  0         0       3    male  22.0
  1         1       1  female  38.0
  2         1       3  female  26.0
  …       …       …       …     …
890         0       1    male  62.0

[891 rows × 12 columns]
891 行は、891 人だった。

データ分析は集団を語る道具です。便利で、強力で、人類が手にした数少ない 「未来を予測する技術」のひとつ。けれどその裏側で、私たちは必ず誰かを取りこぼす。 第5章でのり子は、係数を見ながら気づきます——「個人の決断は、数字には出ない」。 学びの先に、ちゃんと余韻が残る本です。

この2人を、もっと。

のり子とクロコは yatmita のあちこちにいます。無料マンガでも、別の本でも。

ノリとクロコのデータ探検 — Titanic 編のり子とAIクロコの、891人をめぐる121ページ

  • Kindle Unlimited なら、読み放題
  • 単品購入 ¥1,250 / 121ページのマンガ + 深掘りコラム
  • Σ も σ も出てこない。Colab で、その場で手を動かせる
探検をはじめるKindle Unlimited 読み放題 / 単品 ¥1,250

著者 幸田蔵人 / マンガ+コラム / ↗ Amazon が開きます

← yatmita のマンガ一覧へ