投稿元:
レビューを見る
データの本質を見極める力。そうした統計のリテラシーを、本書では「データセンス」と呼ぶ。(pp.274-275、訳者あとがきより)
いわゆるビッグデータ系、統計系の一冊でした。
付箋は17枚付きました。
投稿元:
レビューを見る
統計やデータ処理の欺瞞的使用について実例をあげて詳述したもの。扱われているデータがロースクールのSAT試験の点数とかグルーポン、アメフトのシミュレーションゲームなど、日本人には関心のない分野が多いため、読む気力がなかなか出にくいかも。
・ビッグデータは基本的に、因果関係について何かを語るものではない。データの洪水が、隠れていた因果関係をさらけ出すというのは、ありがちな誤解だ
・2009年にグーグルのエリック・シュミットCEOは「誰にも知られたくないことがあるなら、最初からやらないほうが賢明だろう」と語っている。SNS時代の今、記憶しておくべき発言
・買い物内容から妊娠しているかどうかを判定し、妊婦用品のダイレクトメールを送るというマーケティング手法について、擬陽性、妊娠していない女性について、これを妊娠しているとみなして広告を送りつけることの危険性が語られている。女性客の10%が妊娠しているとして、20%の的中率(これでもすごく高いんだとか)のアルゴリズムでは、14/90(16%)は妊娠していないのに広告のターゲットになる
・統計モデルはニュートンの重力のモデルとは違う。りんごを木から落とす下向きの力は、昨日も、きょうも、明日も働く。しかし現実世界の相関関係は一貫性とはほど遠い。あなたがきょう緑色の傘を持っているからと言って、次に買う傘も緑色とはかぎらない。因果関係を無視するモデルは物理科学の世界ではモデルとして認められることはない。この構造的な限界は、データがどれだけ大量にあっても乗り越えることはできないのだ。
・ビッグデータと黒い白鳥が他喜悦したら、勝つのは黒い白鳥だ。
・誰もあえて口にしないが、相関関係のモデルが導き出した予測の大半は間違っている。人間の行動という万華鏡を、公式に押し込もうとしても無駄なだけだ。ビッグデータの到来は、理論の終焉ではない。あらゆる統計モデルに仮説が含まれている。
投稿元:
レビューを見る
サブタイトルにあるように「統計の嘘」的な本。
こういう本にありがちなんですが、若干例示がだらだらと続いて長めです。
ただ、翻訳が平易なので、読みやすくはあります。
投稿元:
レビューを見る
様々な事例と共に情報を見たときに感じる「違和感」を大切にしてというメッセージが詰まった書籍。筆者の前著、ヤバイ統計学も読んでみたくなった。
投稿元:
レビューを見る
統計的センスについて語られた本。ビッグデータが重要だと言われているが、たくさんデータを集めれば自然と因果関係が見つかるというものではなく、正しい結論のためには正しいセンスが必要だというものだ。分析するためには正しい仮説が必要だし、相関関係が因果関係を示すものでないことにも注意することが必要だ。このような状況で、「問題あるデータやアナリストを見たときに、何かが違うと感じる。それがナンバーセンス」だということだ。
その例として、Gruponのビッグデータによるターゲティングの嘘が暴かれる。実際の問題として全く興味のないクーポンが送られてくることがある。店の方からしても、クーポンがなければ来なかった客が来れば店にとってはプラスだが、クーポンがなくても店に来るお客が使ったクーポンは店にとってはマイナスになる。そういった客はリピーターになりにくいという問題もある。そのようなお客が増えることで、お得意さんの足が遠ざかる可能性もある。
他にも、大学ランキングの大学側の統計情報の操作、肥満と脳卒中のリスクの評価、アメフトのシミュレーションゲーム、などが取り上げられている。
統計情報って扱う人によって薬にも毒にもなるわなと。
少し翻訳について言うと、NFLのレジェンドPeyton Manningの弟で、スーパーボウルを制したこともあるEli Manningのことを「エリ・マニング」と訳してしまうのは少々迂闊だと思う。Eli Lillyという会社もあるのだから、きちんと「イーライ・マニング」と訳してほしかった。そのあたりに翻訳者としての誠実さが出るんだろうなと思うんだけれど。どうでもいいと言えばどうでもいいことなんだけれども。
投稿元:
レビューを見る
統計などを見るときに注意しないといけないことが、具体的な事例を使って書いてあってよかった。結局のところ、そのデータがどのように取得されているのかを知り、その条件により、どのようなことが起こりうるのか考えながら、データを見る必要があるのだと感じた。
投稿元:
レビューを見る
ビジネスでありえる数字を使った考える話題の例
色々考える必要があるよねという話だけど、なんか読みにくい。数字の話を文章では辛いな
シンプソンのパラドックス、中央値をずらす為の工夫、マーケティング、判定基準、予測モデル