- · 《科学学研究》栏目设置[08/31]
- · 《科学学研究》数据库收[08/31]
- · 《科学学研究》收稿方向[08/31]
- · 《科学学研究》投稿方式[08/31]
- · 《科学学研究》征稿要求[08/31]
- · 《科学学研究》刊物宗旨[08/31]
技术预见国际研讨会大数据与技术预见(4)
作者:网站采编关键词:
摘要:我们正在迈入数据技术时代 蒋正伟:阿里研究院数据专家 数据技术(DT,Data technology)时代具有两个本质特征:一是IT成为基础设施,人们离不开互联网;
我们正在迈入数据技术时代
蒋正伟:阿里研究院数据专家
数据技术(DT,Data technology)时代具有两个本质特征:一是IT成为基础设施,人们离不开互联网;二是数据成为生产要素,人们的生活被数字化,被大量数据嵌入和包围。不同于农耕时代和工业时代,DT时代的社会形态是信息社会,信息资源上升到和物质与能量同等重要的战略资源高度,经济形态是以网络经济为主的数据经济,生产力具有分布式多元协同的特质。当千差万别的数据碰在一起,能够产生经济价值,产生人类能够理解的、具有经济意义甚至是社会治理意义的信息,即实现分布式多元数据的协同。
在传统社会里,商业运作的逻辑是线性控制逻辑,以企业为中心,企业内部以科层制来协调各个分裂的环节,企业之间则是链主主导的供应链。而在DT时代,商业逻辑已演进为网状协同逻辑。以消费者为中心,企业内部社区化,企业之间价值网协同。我们需要更多关注于消费者,应该分析消费者需要什么,进而满足其个性化需求,这也将是中国未来弯道超车的好思路。
如何分析和处理大数据
西尔万·勒菲弗(Sylvain Lefebvre):法国巴黎高等电子研究所副教授
毫无疑问,大数据对我们来说有着巨大的价值,基于大数据产生的服务正在改变着我们的生活。比如过去我们去一家实体书店,如果想了解我们要买什么书就必须咨询店员,而现在可以通过网站,基于消费记录,分析并向你推荐你可能感兴趣的书籍。为了提供这样的服务,我们需要对海量数据进行实质性分析以搜集其中有意义的信息,并对数据进行实时分布式处理。处理数据的工作流程主要分为四个阶段:第一,捕捉和收集数据;第二,以一种高效、安全的方法储存数据;第三,分析数据;第四,视觉化处理数据。
MapReduce框架是数据分析和处理的一个主要框架。该框架由谷歌在2004年推出,其目的是在多个机器间进行流程并行化,将处理任务进行分离,提供简单的并行化流程和分布式处理,实现容错和平衡,为程序员提供方案。MapReduce框架取决于两大前提,分别是映射(Map)和归约(Reduce),这个模型将任何一种计算分成两个部分,即映射传播数据和数据简化。我们将数据流与数据库结合在一起,对其进行自动化和丰富化。
数据开放共享已经成为新兴态势
埃德蒙·格斯特纳(Edmund Gerstner):自然集团大中华区执行主编
从论文分享开始,公开科研数据已经成为新的潮流,很多出版商都创建了自己的商业模式,包括自然出版集团。短短20年,中国在包括自然杂志在内的知名期刊中排名前千分之一的高引用论文的贡献率从0.5%迅速增加到20%,这也就是我们看中中国科技发展的原因之一。更广范围进行分享和公开,将对中国科研有很好的促进作用,也能提升影响力。
对于研究者和研究机构,开放共享数据可以提升投资回报。开放的数据共享能帮助我们调整刊物发表的偏见,降低错误和欺诈,能更好地分析和集成数据,对已经发布的研究结果进行再论证。加拿大的研究理事会、国家公共卫生研究局,都要求研究者进行数据分享。李克强总理也非常关注开放性气氛打造,科学技术的开放获取,契合现实需求,符合未来方向。
打通数据开放共享的通道
瓦尔特劳特·里特(Waltraut Ritter):Knowledge Dialogues组织创始人
数据不再是研究的副产品,数据是宝贵的,数据甚至能改变我们的研究方式。因此,数据是未来创新的核心要素,打通数据分享的通道,一定能让技术创新速度快速提升。
欧洲所有的出资机构都要求数据必须分享,现在欧盟已经在28个成员国开展数据分享。但这在香港很难实现,众多高校教授、老师都依赖数据进行论文撰写,但是他们都不愿意分享自己的数据。同时,这也需要大学校长确保所有出版的资料都是透明的,但在香港只有一两名校长有这样的思维和意识。如果数据能被充分的利用和分享,那势必对科学研究具有极大的推动。香港在2000年前后,做出过“数据ONE”的决策,希望能够把实时传输数据、气候数据等进行公开,这样很多的软件开发者将使用这些数据来提供服务。但是数据并不是标准化、系统化的,所以只公开政府数据并不够,还需要有人进行标准化的工作,以便用户使用。
澳大利亚国家数据服务中心正在尝试改变他们的数据系统,建立一个标准化的数据基础设施,从而打通数据开放共享的通道。同时在政策和数据基础设施之间达成协调,这样一来,开放数据可以节约搜索数据的时间,创造更多时间去思考这些数据的含义,充实和丰富研究内容和意义。作研究。我们可以从这些研究中获得结果,来为创新过程确定概念并建立模型,并推广运用到工程、艺术、科学和社会领域的方方面面。
文章来源:《科学学研究》 网址: http://www.kxxyj.cn/qikandaodu/2021/0708/632.html