大数据科学与工程专业设置探索
作者:卢涵宇 张达敏 杨平
来源:《电脑知识与技术》2014年第24期
摘要:针对贵州大数据产业发展的实际需情况,分析大数据的关键技术及特点,结合贵州发展和打造大数据产业的三大机遇和五大优势,对贵州大学设置大数据科学与工程专业的优势进行了分析和展望,利用更好的培养大数据产业人才。 关键词:大数据;大数据科学与工程;人才培养
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)24-5715-02 Big Data Science and Engineering Research LU Han-yu, ZHAGN Da-min, YANG Ping
(College of Big Data and Information Engineering, Guizhou University, Guiyang 550025, China)
Abstract: In view of the actual Guizhou data industry development needs, analysis of the key technology and the characteristics of large data, combined with the three big opportunities in Guizhou development and create large data industry and the five major advantages, the advantages of large data of Guizhou University science and engineering are analyzed and discussed, using the industry data better talents training.
Key words: Big data; Big data science and engineering; Personnel training
随着计算机网络、物联网、云计算的快速发展,大规模数据已经融入我们工作和生活中。2011年5月,全球知名咨询公司麦肯锡发布了《大数据:创新、竞争和生产力的下一个前沿领域》报告,首次提出了“大数据”的概念;2012 年世界经济论坛发布了《大数据、大影响》的报告; 2012年3月,美国总统奥巴马宣布启动“大数据研究与开发计划”,提出将“大数据”研究上升到美国国家战略的最高层;2012年5月,香山科学会议组织了以“大数据科学与工程:一门新兴的交叉学科?”为主题的学术讨论会,与会的学者、专家就大数据的理论与工程技术研究、应用方向以及大数据研究的组织方式与资源支持形式等重要问题进行了深入讨论,值得我们进一步的深入研究和探索。 1 大数据的关键技术及特点
大数据技术是一系列收集、存储、管理、处理、分析、共享和可视化技术的集合。适用于大数据的关键技术:遗传算法,神经网络,数据挖掘,回归分析,分类分析,聚类分析,关联
龙源期刊网 http://www.qikan.com.cn
规则学习,数据融合与集成,机器学习,自然语言处理,情感分析,网络分析,空间分析,时间序列分析,分布式文件系统。分布式缓存,分布式数据库。非关系型数据库系统,可视化技术。
大数据一般有四个主要特征,简称为4V特点:
1) 数据量大(Volume),随着时间的推移,数据量级已从TB发展至PB乃至ZB,可以称为海量、巨量乃至超量。
2) 数据种类多(Variety),互联网、物联网、传感网的发展,使数据类型变得更加复杂,不仅包括传统的关系数据类型,也包含为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。
3) 处理速度快(Velocity),面对快速动态变化的流式数据,需要快速、持续的实时处理海量数据。
4) 价值高密度低(Value),数据量呈指数增长加大了获取有用信息的难度,有重大价值者可能仅为一两秒的数据流,如何快速高效发现隐藏在海量数据中的潜在有价值模式也给我们带来了难度。
2 贵州发展大数据的优势
2012年11月,《贵州省委省政府关于加快信息产业跨越发展的意见》出台;2013年初, 《贵州“云计算”战略规划》发布;2014年2月,贵州省政府审议了《关于加快大数据产业发展及应用若干政策的意见》、《贵州省大数据产业发展应用规划纲要2014-2020》;根据以上政策,贵州省将按市场机制组织和设立“贵州大数据产业投资基金”,分期募集,首期规模15亿元,由财政投入引导资金5亿元,其余资金采取市场募集。着力市场应用培育、支持技术创新、强化信息安全保障。
贵州发展大数据产业有三大发展机遇和五大优势。三大发展机遇是:国家和贵州省全力支持为大数据产业发展提供政策保障、贵州省重视电子信息产业为大数据产业发展提供产业基础、经济社会加速转型升级为大数据产业发展提供市场需求。五大优势是:生态优势,气候环境优良,地质结构稳定;能源优势,水煤资源丰富,电力价格低廉;区位优势:地理位置特殊,交通日趋便利;战略优势,西部重要增长极,内陆开放新高地;产业优势:贵州历史上是三大军工基地,现在有三大运营商开放运营,将为大数据产业提供广阔的市场空间。 2013年8月至2014年7月,不到一年的时间, 贵州全力推动电子信息产业高端化、集群化发展,富士康第四代绿色产业园、中关村贵阳科技园以及电信、移动、联通三大运营商数据中心等一批重大信息产业项目“云”集贵州,贵州有望成为全国最大的数据聚集地之一,大数据产业基地雏形初显。
龙源期刊网 http://www.qikan.com.cn
3 贵州大学设置大数据科学与工程专业探索
贵州省作为全国欠发达地区,发展大数据产业主要面临三个急待解决的问题:第一,大数据是一门新型技术,技术领域涉及面广,因此发展大数据,不可避免的需要技术创新;第二,伴随着大数据与贵州省各行各业的深度融合,我们需要依据贵州省本地的发展特点,在充分理解各行业本地情况的前提下,既要量身定做具有贵州特色的大数据本地化应用及技术人才,也要为全国培养和输送大数据相关人才;第三,贵州省的大数据发展需要充沛的人才配给,然而,作为西部欠发达省份,贵州省在人才吸引上存在一定的难度,因此,贵州省需要大力在省内培养具有大数据专业技术的人才,满足大数据建设和大数据产业发展的需要。
以《贵州省大数据产业发展应用规划纲要2014-2020》为指导,在贵州省委、省政府的指导下,依托贵州大学电子信息学院电子科学与技术系、信息与通信工程系,整合贵州大学管理学院信息管理与信息系统专业、计算机科学与技术学院物联网工程专业,组建贵州大学大数据与信息工程学院,新学院下设三个系:电子科学与技术系、信息与通信工程系、大数据科学与工程系。
3.1 贵州大学发展大数据科学与工程专业的探索 3.1.1 学院战略定位
贵州大学大数据与信息工程学院的大数据科学与工程系的核心使命是为贵州乃至全国大数据产业培养中、高端人才,同时通过与优质企业合作,研发大数据相关技术和应用,为地方经济、社会发展服务。其战略定位是探索大数据人才的新型培养模式,结合贵州乃至全国大数据产业发展实际,面向中关村贵阳软件产业园、贵阳国家高新技术产业开发区、贵安新区、贵州省、乃至全国的信息产业发展,抢抓机遇,以大数据产业及应用为突破口,量力而行,逐步推进,为发展大数据产业提供智力支持和人才保障,推动我省信息产业的跨越式发展。将学院建成在全国具有示范性和标志性的大数据和电子信息产业人才培养基地。 3.1.2 人才培养定位
学院将从人才培养、科学研究、产学研合作等三方面开展工作,在深入研究大数据技术以及以云计算技术、并行计算技术、数据分析技术为代表的先进计算技术的基础上,充分研究贵州本地和全国的大数据应用需求以及国际应用发展趋势,把先进的科研成果应用于实际的大数据产业建设中,同时培养一批高素质高水平的大数据技术人才。
以贵州大学现有基础建设大数据与信息工程学院,可以构建本科+硕士+博士+博士后一体化的人才培养基地,为贵州地方经济服务,为贵州省和全国大数据产业发展服务。
通过博士后与博士的培养,可以为贵州省和全国大数据产业的发展培养高端人才和领军人才。
龙源期刊网 http://www.qikan.com.cn
通过硕士生的培养,可以为贵州省和全国大数据产业的发展提供高级数据工程师、数据分析师以及基于大数据应用的系统开发人员。
通过本科生的培养,可以为贵州省和全国大数据产业的发展提供中级人才,服务于服务器架构、服务器维护、系统开发、移动互联网应用开发等大数据相关产业。
通过与省内外有影响的信息技术企业联合构建大数据技术实训与培训基地,对贵州省现有企业进行大数据技术培训。
通过学院的建设与发展,可以在未来为贵州省和全国大数据产业的发展提供强有力的智力支持和人才保障。
3.1.3 学院发展阶段定位
2014年5月,正式成立贵州大学大数据与信息工程学院,确定基于大数据科学与工程专业面向本科计划招生100人,相关学科已录取的研究生适量进入大数据研究方向;
2015年,依托学科优势申请“大数据技术与应用”软件工程硕士专业,拓展研究生的招生与培养;与优企联合申请大数据技术工程实验室或研发中心,加强产学研合作和人才培养; 2016年,扩展大数据技术相关招生专业及招生规模;与优质企业联合申请基于大数据技术研究的博士后工作站,强化高端人才的引进和培养;集合相关学科力量支持成立省级重点实验室,加强和充实科研力量和科研梯队建设;
2017年,配合贵州省大数据产业的发展,进一步扩展招生专业与招生规模,逐渐建立起博士后—博士—硕士—本科全方位人才培养体系; 3.2 贵州大学发展大数据科学与工程专业的建议
在大数据时代,数据的收集、获取和分析都更加快捷,这些海量的数据将对我们的思考方式产生深远的影响:(1) 分析数据时,要尽可能地利用所有数据,而不只是分析少量的样本数据;(2) 相比于精确的数据,我们更乐于接受纷繁复杂的数据;(3) 我们应该更为关注事物之间的相关关系,而不是探索因果关系;(4) 大数据的简单算法比小数据的复杂算法更为有效;(5) 大数据的分析结果将减少决策中的草率和主观因素,数据科学家将取代“专家”。
从教学、科研、人才培养方面,我们要从大数据中应用提取价值的5种主要技术。 1) 预测:觉知预料中的事实的可能性。例如要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力,
龙源期刊网 http://www.qikan.com.cn
2) 聚类:发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。
3) 相关性挖掘:发现各种变量之间的关系,并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。 4) 升华人的判断:建立可视的机器学习的模式。
5) 用模式进行发现:使用通过大数据分析开发出的模式进行“元学习”。
实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。 4 结束语
总之,我们应该积极迎接大数据的新时代,通过大数据来分析学习,进一步改善教学的方式与方法,进一步促进学生学习成绩的提高和培养大数据专业的创新型人才,高校工作者也应当从多个方面进行创新,以适应大数据环境下教学、科研人才培养的需要。 参考文献:
[1] 《贵州省大数据产业发展应用规划纲要2014-2020》. [2] 贵州大学大数据与信息工程学院建设方案(2014) .
[3] 张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013.50(增刊):216-233.
[4] 屈莉莉,陈燕.大数据背景下数据挖掘课程的教学改革与探索[J].计算机研究与发展,2014.16(4):57-58.
[5] 严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013.23(4):168-172.
因篇幅问题不能全部显示,请点此查看更多更全内容