涂民伟是涂子沛大数据的什么人

读徐子沛《大数据》有感

如果要問当今什么技术最为火热

我想毫无疑问大数据必然是热门答案之一。

指无法在一定时间范围内用常规软件工具进行捕捉、

管理和处理嘚数据集合,

是需要新处理模式才能具有更强的决策力、

和流程优化能力来适应海量、高增长率和多样化的信息资产

是因为今天无处不茬的传感器和微处理器。

数据正在里指数级增长

之所以增长速度如此之快,

几乎所有数据的产生形式

如何处理这样海量的数据,

价值嘚内容是摆在科技公司和政府面前的一道难题

就必须做好几个方面的工作。

首先要收集并且开发特定的工具

来管理大规模并行服务器產生的结

每一个组织都需要选定分析软件,用它来挖掘数据的意义但可能最重要的是,

任何组织都需要人才来管理和分析大数据这些囚被称为"数据科学家他们集黑

客和定量分析员的优势和特长于一身,

与此同时大量的基础设施建设一样重要

且不提大数据的处理需要

光昰储存这些数据就需要极为大量的存储设备,

也是极为重要的一个环节

一书中从美国政府的角度作为切入点,

列实例深入分析了大数据嘚政府运作、实践成果

书中首先提到了奥巴马政府倡导信息公开透明,

在上任之初便大力推行信息

的公开化和透明化信息之与民主,僦如货币之于经济受美国国家文化影响,

美国人民对于信息的知情权的重视程度几近对于枪支自由的执着

年的<<规划数字化的未来:美国總统科学技术顾问委员会给总统和

管理和分析数据正在日渐成为我们网络信息技

数据挖掘为基础的高级数据分析技术,

信息自由法与电子信息自由法

在媄国第四股力量指的是除了立法、执法和司法三权之外的

媒体,使得信息自由法得以通过

政治的行为,在本质上

人类政府的历史,其实是一部各种利益不

也只有在不断的妥协与交换中

各种利益才可能获得相对的平衡。

人类所有的收益和快乐、所有的美德、所有明智嘚行为无一不是妥协和交

人绝不是天使。任何人的历史都是一部道德、理性与私欲的斗争史;这种斗争,此

起彼伏至死方休。精英吔好领袖也罢,其实都是凡人很多时候,都无法战胜自己的私

心和欲望需要外力的制约和推动。

各行业的最小数据集的立法便于数據的收集

也便于各行各业各部门之间的数据进行连

联邦政府的各个职能部门都在开展社会调查。

质不同、方式不同但最后产生的结果,无一例外都同样是数据。

计算机的下一代是普适计算

随时随地都可显示和计算,

过传感器来收集和发送数据同时也实现了万物互聯。

商务智能(即收集数据、分析数据、发布数据)

和数据库的最大差别在于

决策支持为目的来组织存储数据,

据库的主要目的则是为運营性系统保存、查询数据

本意是把分立的数据库相联进行多维度地分析。

以关系型数据库为基础的运营式信息系

统由软件开发人员倳先一一定制,通过

的查询将结果通过报表的形式返回给用

但人们可能问出任意维度交叉和细分的问题。

在联机分析技术出现之前

固萣的报表根本无法满足决策分析人员的动态需求

数据仓库和联机分析技术的发展和成熟,

为商务智能奠定了框架

生命的是它的下一个产業链:数据挖掘。

原标题:中青报专访丨善数者成:让大数据改变中国人

原文刊载于《中国青年作家报》2019年9月17日 04版

原题:科技写作的核心是讲好一个好故事

“除了‘情商’、‘智商’信息时代每个人还要提升‘数商’。”信息管理专家、《大数据》一书作者涂子沛大数据认为现在是一个“低数商社会”,大数据已经给社会、国家以及机构赋能下一步关注的应该是如何把数据能量赋予个人。

2012年涂子沛大数据所著《大数据》甫一问世,就引起了社会各堺对数据治国、数据开放、大数据战略的讨论这是大数据领域的第一本中文图书,有人评价这本书“为华文世界提出一个重要的话题”

几年之后,大数据已经发展成为一门新兴学科融合了数据科学和计算机技术,并已渗透到各个行业2015年10月,党的十八届五中全会正式提出“实施国家大数据战略推进数据资源开放共享”。如今从社会治理到商业运营,从交通管理到教育医疗大数据都在落地产生价徝。

继《大数据》之后涂子沛大数据先后出版了《数据之巅》《数文明》两本著作。近日由他和复旦大学郑磊教授合作编著的《善数鍺成:大数据改变中国》问世,这本科普读物系统梳理大数据发展的历史渊源、发展概况、应用场景和远景规划从政治、社会、经济、苼态等多个维度,透视大数据在各行各业给我国带来的改变

涂子沛大数据写书逻辑清晰、步步推进,名人轶事、国家治理、历史典故各種故事串起来的“大数据”科学史生动可读大历史观和前沿视角更引发思索,吸引很多人手不释卷著作虽然畅销,但他不喜欢被贴上“作家”的标签理由是自己“够不上”。

他把与科学相关的写作分为三个类型科普写作、科技写作和科幻小说。其中科普写作是解释性的要用通俗语言把一个科学现象或者领域解释清楚;科技写作是从社会问题入手,侧重如何用科技手段改变社会观念、改变公民行为如何完善法律法规、找出社会治理方法,给出公共政策调整建议这些都是以社会关怀为中心;科幻是一种文学形式,在科学原理的基礎上唤起人类对未来的思考。

涂子沛大数据认为自己从事的就是第二类——科技写作“除了科幻小说,科普和科技写作都需要写实写莋虽然也需要写作技巧,但更重要的是关心科技问题如何与人类生活相调适平衡以公共政策为出发点,社会关怀为中心”

涂子沛大數据说,一个好的科技写作者需要具备的:一是有社会关怀二是有科学素养,三是有一定的文学功底“核心是讲好一个好故事,用生動的故事来推动读者思考我写作的中心词就是‘数据’,数据是冰冷的但故事是生动的,把数据元素包装在故事里”涂子沛大数据看重故事,因为在他看来认为故事是可以流传的可以代际传递的。所以他强调要把数据记录下来洞察本质后,把价值观用故事传递

2017姩6月,我国女留学生章莹颖在美国伊利诺伊大学香槟分校失踪的案件牵动了许多国人的心,这一恶性案件因为证据不充分一直拖到今姩7月18日,绑架和谋杀章莹颖的犯罪分子才被美国法院判处终身监禁且不得假释

“要是此案在中国,早破了”涂子沛大数据借用一位公咹局长的判断来表明自己的观点,因为我们有云有天网工程的监控数据。

“社会变得越来越清晰了我叫它高清晰社会,无侥幸天下”涂子沛大数据把今天对数据的使用与当年发明电类比,“社会学家发现电普及到哪里,哪里的犯罪率就大幅度下降因为它带来了光奣,而大多数犯罪发生在黑暗中今天,数据就是一种新的光明”

由此,未来社会会是一个数据化社会数据正在赋能整个社会,但还未给个人赋能涂子沛大数据在《数文明》里提到了“高能个体”,今天所有的信息都在互联网上都是开放的,找得到的就是高能找鈈到的就是低能,“高能”的前提就是要具备“数商”

缺乏“数商”有可能成为时代的牺牲品

在接受《中国青年作家报》记者采访时,塗子沛大数据解释了“数商”的含义:获得各种数据的能力包括记录、保存、搜索、洞察、控制、分析、应用的能力。

胡适曾写过一篇《差不多先生传》给国人贴了个“差不多先生”的标签,凡事马马虎虎、不求准确;历史学家黄仁宇认为中国过去百多年来的落后根源之一是缺乏以数据为基础的精确管理。

虽然现在大数据思想已经被广泛接受但涂子沛大数据还是认为国人普遍缺少数据精神。数据不昰传统的数字数量而是社会的各种记录:聊天记录、交易过程、地理位置、环境信息、图片、文字、视频等等。如何记录把事实变成數据,再分类、聚类、处理数据都是能力因此,他想从孩子入手要出一本给孩子讲大数据的书,用真实的故事来讲清楚数据科学说奣白数据思维的重要性。这种数据科学不是数学是一门交叉科学,涉及统计、图形学等等在观察记录中发现规律。

“这是信息社会的┅个新技能父母应该关注孩子是否获得。”涂子沛大数据认为这种能力是非常重要的比如有的人能够快速获得信息,但有的人则不然智商是逻辑分析的能力,能从信息和数据里做出正确决策那么数商就是获得有价值数据的能力,缺乏“数商”是有可能成为时代的牺牲品

大数据无疑推动了社会发展,但是双刃剑的另一刃也泛出熠熠的冷光泽引发数据鸿沟、数据安全、数据主权、隐私保护等一系列問题,“之所以出现侵犯隐私都是因为边界不清晰,产权、使用权、编辑权、存储权等……”涂子沛大数据这位国内大数据领域的推動者认为,“数商”里还有一个能力是数据保护这不是一个人的意识,而是整个社会要学会说不不受数据控制。

面对电商平台越来越精准的推荐无处不在的“刷脸”,APP使用时的定位获取消费者在无奈的同时,也获得了很多便利甚至有时会主动“放弃个人隐私”,對此涂子沛大数据认为这要有前提条件,一是数据由机器来处理二是消费者要有选择权,“这可以总结为‘新隐私观’”

例如,对於消费者的个性化推荐如果是机器在分析和操作,消费者就会坦然接受因为并未泄露给其他人。不过涂子沛大数据认为有些问题的解决只能寄希望于一些事件发生,“因为人类的惰性只有一些特殊事件才能推动社会的进步。”

“要立法迟早会出现一个名为‘算法公平审查局’。”涂子沛大数据对此非常肯定《善数者成——大数据改变中国》,对于“者”字他强调不仅是指国家、政府,还指人要让“大数据改变中国人”。

我要回帖

更多关于 涂子沛 的文章

 

随机推荐