这本书站在数据科学与社会科学的十字路口,教你利用数据方法增强科学洞察力;收录了大量多样化的案例,用每个人都能听懂的语言描述了一套测量世界的全新思维工具;这是一本社会科学家的“跨界指南之书”、数据科学家的“素养提升之作”。不论你是想了解大数据的10个共同特征,还是想理解大公司的道德伦理困境,这本书都值得反复翻阅;《科学》杂志、《福布斯》杂志赞誉有加。哈佛大学教授加里?金,微软研究院首席研究员邓肯?瓦茨,脸谱网数据科学家肖恩?泰勒,北京师范大学系统科学学院教授、集智俱乐部创始人张江,鼎力推荐!
$ a# K& S9 w0 F4 l* {' `6 K 内容简介1 i0 e/ c: g3 Q( b
我们已经见证了社交媒体、智能手机以及其他科技奇迹的诞生与进化,这些科技工具让我们能够以前所未见的规模和深度采集并处理有关人类行为的数据,从而为研究人类社会提供了一个全新的路径。这本书是一部里程碑式的作品,它将彻底改变下一代社会科学家和数据科学家探索世界的方式。大数据的10个共同特征是什么?如何通过数据预测美国总统大选的结果?如何在短时间内对100万个星系进行分类?大规模数据采集面临着怎样的道德伦理困境?科技公司是否在监视我们的行为,数字时代是不是将我们带进了“全景监狱”呢?在计算社会学这一新兴领域,作者阐述了数字革命如何扭转了社会科学家和数据科学家观察行为、提出问题、开展实验和进行大规模协作的方式,详细描述了大批真实的案例,并且划定了面临伦理挑战时需要遵循的4项原则。这本书用全新的数据模式解锁了社会学。对社会科学家来说,它是一本跨界指南之书;对数据科学家来说,它是一本素养提升之作。 B5 Z' s3 W! q b$ ?9 Q
作者简介
8 w1 }2 X( Y1 |3 U# m2 x) t( `5 c [美]马修?萨尔加尼克(Matthew J. Salganik)普林斯顿大学社会学教授,同时任职于该校的信息技术政策中心、数据与机器学习中心等。《科学》杂志评价他是“纯然的计算社会学家”。他的研究方向是社会网络、计算社会学。他的研究曾被微软、脸谱网和谷歌资助,并被《纽约时报》《华尔街日报》《经济学人》《纽约客》等主流媒体报道,美国公共广播电台还专题报道过他的研究成果。' H. E& |' q% ?2 c
目录& Z9 @2 l5 u: W: Q) f8 ~+ u' C
版权信息% L \2 u Z' u
前言
- B8 f X( _, I7 S) H: G: z 第1章 简介, e/ r3 R# g8 v
1.1 一处墨迹
2 w" G. a4 i1 ]% ^ 1.2 欢迎来到数字时代+ w" o1 y8 c/ K+ Z6 |3 \4 W5 z
1.3 研究设计& Q) f n# W& P' H3 E+ H' a
1.4 本书的主题0 w) B2 h# b- W0 d
1.5 本书梗概3 }3 v& V1 B: w- t" {2 S5 A
第2章 观察行为
! N1 P, {; s a6 n* H- G. t 2.1 简介 X- ^) X: o# ?8 Y+ Q4 C
2.2 大数据2 O/ o. f( G7 ]3 U! i
2.3 大数据的10个共同特征4 v8 h/ F4 ? E9 t
2.3.1 海量性4 V+ n9 w4 E8 Y" d
2.3.2 持续性
( t+ c: q2 ^" v5 R& ~( _. x 2.3.3 不反应性
9 s6 Y0 @5 Q- O3 c2 i 2.3.4 不完整性, j- t6 M& ~ T* `
2.3.5 难以获取
2 {+ }. s: k; h ]. ]9 ?/ Y 2.3.6 不具代表性
3 v9 `. g4 E ]. {2 o7 f 2.3.7 漂移
8 g8 u2 k# Z5 j' N, N3 u. d 2.3.8 算法干扰
, }3 p# y9 F8 O' j& Y% k 2.3.9 脏数据
+ t6 T9 \4 R8 L: ] 2.3.10 敏感性
* i& j% n7 u) p! @$ U- q) S0 ^ X 2.4 研究策略
: ?. _2 C% P- i* _+ {4 X 2.4.1 计数
; G& ~& v7 f4 C- J$ A: @. Y3 g 2.4.2 预测和临近预测0 g) k* X* g( y8 V: N
2.4.3 近似实验
- k$ D6 s4 j/ f; q4 Z) E 2.5 结论
' h; d9 h1 D+ W2 O, P! u8 { 第3章 提问
* y8 O# F* H) j4 [! I; N! z 3.1 简介
% ?% ^6 J) H$ @3 `1 D( T8 c: n5 q" k 3.2 提问与观察7 H' i! K& [9 P5 B- d8 C0 \
3.3 调查误差总框架* ?; P% H0 E8 A. U+ [3 E& f4 D
3.3.1 代表性; N' A5 u0 a- n5 K" T4 M: c
3.3.2 测量; W- j4 p/ H: {0 x
3.3.3 成本
5 T; l, H+ e, ]" M9 F( |# f 3.4 向谁提问1 | j+ d# \" }9 O
3.5 提问的新方法
+ n2 w3 f. n& ^0 t7 Q/ D# t 3.5.1 生态瞬时评估法
, D( @+ e' q3 l+ h/ [% J: r 3.5.2 维基调查+ L4 f: k/ ]7 _% D n6 u
3.5.3 游戏化" ?: z `6 T) q
3.6 与大数据资源相结合的调查
4 D9 O8 S# d9 A$ [, I3 {7 v4 Q 3.6.1 丰富型提问$ s X) u2 l4 P
3.6.2 扩充型提问) [$ o9 M& f0 f8 ~
3.7 结论
: t3 I4 V" z- z$ W8 z& s 第4章 开展实验
. ?) S! I! T- H. E s' W 4.1 简介3 ^: j; j6 \/ g
4.2 什么是实验
|9 |* t' T! s+ {' ^7 t- X 4.3 实验的两个维度:实验室–实地以及模拟–数字4.4 超越简单实验 }2 A$ a5 Y) f. k x
4.4.1 效度
* m# J4 x8 @- |9 d W 4.4.2 处理效应的异质性' R* y% o# U) J
4.4.3 原理
9 L$ t; |& l" L' p) ^8 ] 4.5 使实验成为现实$ W: \* c- X3 j
4.5.1 利用现有环境开展实验" p: g% g% P X* I3 ^
4.5.2 创建自己的实验 X1 T6 \5 P3 Q8 K& s
4.5.3 创建自己的产品 ]6 M+ G. W; F* V7 q4 d) W0 j7 Z
4.5.4 与有能力的组织合作% Y1 ^& A- c: C8 |* E7 O
4.6 建议) _) G' o* F, Z% S; O i/ @/ w. v2 Z
4.6.1 创造零可变成本数据
* V; M$ G% c4 ^% K4 ~ 4.6.2 将道德伦理融入你的设计:替代、改进和减少4.7 结论; @' l' Y3 q f* ]' Q3 s
第5章 进行大规模协作& i) m$ H" T8 A- Z8 A' i
5.1 简介/ z) `' e" ]3 k8 t" u. V8 @6 h/ Y' A
5.2 人本计算
: @& a. N. o% o& o* E 5.2.1 星系动物园
$ q5 W: v& Q7 i( |. ` 5.2.2 政治宣言的公众编码2 ~( E8 K" g9 f) |& r0 z5 D
5.2.3 结论
4 ^& T+ k3 _ `4 n 5.3 公开征集
) d6 x1 f, p7 q$ R 5.3.1 网飞奖+ }" o# M2 u; o7 X
5.3.2 蛋白质折叠游戏: K: ]- W5 A* z, l# M' v8 v+ \: n
5.3.3 公众专利评审( g+ t8 c# K" c8 d
5.3.4 结论
3 v- J: W, S/ t9 O: J 5.4 分布式数据采集0 ?0 j" p) v% Q" |4 G0 W; v" i
5.4.1 观鸟数据库$ Y$ X! w) K# H; c9 E( m" S2 K
5.4.2 照片城: u, A: M* Y' E) `! U! J
5.4.3 结论; z% [" o7 r* h' z
5.5 设计你自己的大规模协作项目
* `! j1 Z1 _! f7 V: z 5.5.1 激励参与者) Y) I s {$ B
5.5.2 利用异质性' v8 k' v4 g/ [$ \: b2 y' Z
5.5.3 集中注意力
) Z1 S% R+ G( ?1 e: W! h N1 G 5.5.4 允许惊喜
- H7 i' M9 ]7 ]! m U3 q; \ 5.5.5 合乎道德伦理1 c( I2 h0 u- x' J: ]
5.5.6 最后的设计建议1 {% e1 r5 a! e1 ], T
5.6 结论% b( B" o! z" b' u
第6章 道德伦理% I" D3 ]( E8 j) S- ~$ _
6.1 简介# f" `0 S( N: y
6.2 三个事例
# p2 N7 z4 Z; f+ f0 ? 6.2.1 情绪感染项目, `$ l+ E7 x6 ~) _
6.2.2 “3T”项目& Z, u" Y+ R* R0 c( s" B' Y
6.2.3 “Encore”项目) r) P5 l0 ~2 g- L. O6 Q: d4 Z
6.3 数字时代的不同4 Q* l: Y: n3 O0 e8 O/ E
6.4 四项原则& U' }6 i0 N& P4 ? \1 U
6.4.1 对人的尊重原则, h. Y1 n! E2 @* O; J
6.4.2 有利化原则3 B, ]) B |- H2 G3 L. R) b* d
6.4.3 公正原则
S7 {6 g C' d 6.4.4 对法律和公共利益的尊重原则
; E% F- d7 k6 m" \ 6.5 两种道德框架# |: T5 J* A$ L2 S
6.6 困难面
, b, F2 z# B" M p& M 6.6.1 知情同意2 Y- z5 v$ |& C
6.6.2 理解与管理信息化风险7 u7 f* ^9 i' g! C6 Y% B: j5 P
6.6.3 隐私权9 H' D* C) X+ y8 Y
6.6.4 面对不确定性做出决策
& L9 G% W' o: B0 `" F3 A6 G6 Z- ? 6.7 实用技巧( C" M B1 V$ f* t
6.7.1 机构审查委员会是底线,不是上线! N3 s W3 D5 r; L" j5 [
6.7.2 换位思考) @+ @ o: T' \+ g: H: n3 V( P
6.7.3 将研究伦理视作连续的而非离散的过程
% O2 f# X& W% b( Z( u$ I# V& B 6.8 结论
6 ]- ] k7 y* x; l& D) H6 j7 o 历史附录
5 p0 C2 M) `! a, n, q) r' [ 第7章 未来# n& d1 n0 D2 S* N# X
7.1 展望4 O9 w$ K* Z- C5 S/ p8 B
7.2 未来主题
3 j8 r" R4 b) u7 R m5 r 7.2.1 现成品与定制物之间的融合/ h# V! @+ _( F
7.2.2 以参与者为中心的数据采集* C7 w* x: g; ^
7.2.3 研究设计中的道德伦理
# ?# d8 c6 |; p2 e1 p 7.3 回到开始
3 M3 G& _0 w6 }" N 致谢
) y1 s8 ?3 X. [: i/ [ 参考文献& x: ~. v& B' `+ @* J" Z5 N2 E0 y
7 E; |/ \: B4 h6 h* d0 g) G
" i0 ?; Y6 y6 f8 m: v |