随机变量|数据科学:内涵、方法、意义与发展( 二 )



图 统计学中的随机变量、现实世界的规律与数据空间中的数据集相互对应

(a)现实世界中的规律,如图中所展现的城市三类人群出行规律;(b)用随机变量的分布描述现实中的规律,如图中用三个随机变量的分布来描述三类人群的出行规律,用这三个随机变量之混合分布来描述人群出行的总体规律;(c)数据空间中的数据集,如图为三类人群的地理位置分布数据集,它可视作按三个随机变量之混合分采样的结果

第5章阐述数据科学当前发展阶段所亟待解决的重大科学技术问题.在重大科学问题方面, 我们论证提出了数据科学的重大挑战问题, 并建议聚力突破“四大科学任务”: 探索数据空间的结构与特性、建立大数据统计学、革新存储计算技术和夯实人工智能基础. 在核心技术方面, 我们提出了应重点突破的“十大技术方向”: 物联网、大数据互操作、大数据安全、大数据存储、分布式协同计算、新型数据库、大数据基础算法、数据智能、区块链、大数据可视化与交互式分析等技术.

随机变量|数据科学:内涵、方法、意义与发展
文章插图
图 函数空间上的学习理论

随机变量|数据科学:内涵、方法、意义与发展
文章插图
图 现代社会的重要基础设施

第6章讨论数据科学的学科发展问题, 论证了数据科学的主要研究方向、学科属性和知识结构, 并提出推动数据科学学科发展战略的若干建议.基于重要性、不冲突、专业化和完整性“四原则”, 我们论证提出了数据科学应包含的四个主体研究方向: 数据收集与管理、数据存储与计算、数据分析与解译、数据产品及应用, 论证提出了“数据科学的主体构成是统计学和人工智能学科, 而紧密相关学科是数学、计算机科学和领域相关学科”的“理工交叉、文理交融”学科属性.

随机变量|数据科学:内涵、方法、意义与发展
文章插图
图 ShellyPalmer的数据科学维恩图(2016)

第7章聚焦数据科学的人才培养问题.在分析市场对数据科学人才应具备的知识、能力、素质要求的基础上, 提出“坚持统一性、体现多样性、兼顾成长性”的数据科学人才培养原则和“知识模块化、培养杂糅化”的培养技术方案. 最后, 我们提出数据工程师、数据分析师、数据执行官等数据科学人才培养的建议方案.

正文抢先看

随机变量|数据科学:内涵、方法、意义与发展
文章插图
随机变量|数据科学:内涵、方法、意义与发展
文章插图
随机变量|数据科学:内涵、方法、意义与发展
文章插图
随机变量|数据科学:内涵、方法、意义与发展
文章插图
随机变量|数据科学:内涵、方法、意义与发展
文章插图
随机变量|数据科学:内涵、方法、意义与发展
文章插图
《数据科学 : 它的内容、方法、意义与发展》

徐宗本, 唐年胜, 程学旗 著

北京:科学出版社, 2021.8

ISBN 978-7-03-069288-7


长按识码

即刻购书

科学出版社

内容简介

本书是有关数据科学内涵、方法、历史、意义及方法论、发展趋势、学科边界、核心科技问题、人才培养方案等方面的一部综合性论著.

本书可作为科研和教育主管部门、企事业研发部门、信息产业与数字经济行业决策的参考书, 也可作为数学、统计学、计算机科学、人工智能、管理科学等学科领域的数据科学研究者、信息产业从业者的研究参考书, 可供大专院校数据科学相关专业学科建设和教学参考书, 也可作为数据科学与大数据技术专业、大数据管理与应用专业、大数据技术与应用专业、人工智能专业等相关专业的“数据科学概论”教材使用.