首页 - 范文大全 - 文章正文

综述性论文范文例文(一篇标准的论文范文1500)

时间:2020-08-26 08:52:47 作者:黑曼巴 分类:范文大全 浏览:61

《近十年我国大数据理论的可视化聚类分析基于五种常用文献的计量和统计分析》

本文是一个用于理论研究的学士学位论文模型,也是一个用于统计分析、聚类和公共文献的学士学位论文模型。

【[摘要】简要介绍大数据理论,利用超级巨星发现平台和中国知网数据库的聚类分析功能,从学术发展趋势、热门关键词、核心研究作者、核心研究机构、学科分布、经典文献分析等方面对大数据理论的研究现状进行可视化聚类分析。并提出了一些有针对性的建议。

[关键词]中国知网大数据巨星发现定量分析

[分类号]G353.1

大数据的概念已经受到学术界和现实社会的极大关注。维克多·梅耶尔·勋伯格和肯尼斯·库克在《《大数据时代》》中指出,大数据是指不使用随机分析(抽样调查)的捷径。但是,使用所有数据进行分析和处理。[1]大数据理论的研究发展到什么程度是一个值得讨论的问题。笔者利用相关分析工具,基于五篇常用文献,对大数据理论的研究现状进行聚类分析,希望能为大数据相关研究者提供一些参考。

1统计来源、统计战略和聚类分析工具

为了更真实、更全面地反映近十年来我国大数据理论的研究现状,笔者以图书、期刊、报纸、学位论文和会议论文等五种常见文献为数据统计对象,以超级明星发现平台的海量数据为主要统计来源,以中国知网的相关数据为辅助统计来源。为了使检查结果更加准确可靠,作者使用“大数据”作为检索词,标题和关键词作为检索条目,两者都进行“逻辑或”检索,并限定了2007年至2016年的时间。

作者使用超级明星发现平台作为聚类分析工具,因为该平台不仅拥有——篇期刊论文和学位论文等大量数据资源,而且拥有近300万种图书资源以及各种资源之间的相互引用关系。此外,该平台还可以通过分面聚类、引文分析、知识关联分析等,实现高价值学术文献发现、深度知识挖掘与可视化纵横结合的全方位知识关联功能。这些函数非常适合于这种分析研究。[2]

根据上述搜索条件,截至2017年1月19日,共获得92,444条搜索结果,其中83,661条文档被常用于5个类别,即706本书、41,272篇期刊文章、38,581篇报纸文章、1370篇学位论文和1730篇会议论文。在检索到的其他相关文献中,有大量的信息、专利信息、视频资源和法律法规,而五种常用文献的总量占检索到的相关文献总量的90.5%,这表明对五种常用文献的统计分析能够反映大数据理论的研究现状。

2基于超级巨星发现和中国知网的五种常用文献聚类分析

2.1大数据学术趋势分析

通过统计每年发表的论文数量,我们可以看到某一研究领域的学术研究趋势和关注程度。通过每年发表的文章数量的趋势图,我们可以看到这一研究领域的发展阶段。[3]作者统计了与大数据相关的5个常用文档中每年发表的文章数量,并绘制了趋势图。由于期刊和报纸每年发表的论文数量与其他3种文献类型在数量级上有所不同,因此分别绘制了5种文献的学术研究发展趋势曲线图,如图1和图2所示。

从图1和图2可以看出,大数据理论的研究目前正处于高速发展阶段,尤其是2011年以后,各类已发表文献数量呈几何增长趋势。

报纸文献和期刊文献能够及时反映某一领域的关键研究方向。从图1可以看出,2009年大数据的研究开始进入研究者的视野,到2011年,数据曲线开始呈现井喷,表明该领域的研究受到了学术界的高度重视,研究热情持续高涨

从论文和论证的曲线也可以得出同样的结论,即大数据研究目前正处于高速发展阶段。虽然2014年的会议论文曲线有一个拐点,但2014年和2015年的会议论文总数没有显著差异,这并不影响学术趋势向上发展的结论。与此同时,每年举行的相关学术会议的数量是固定的。因此,这个结果是可以接受的。学位论文和论文在2016年会有所减少,这应该是因为定量统计结果在2017年初,许多相关结果没有及时录入数据库。

从图书曲线来看,它也能反映大数据理论研究的上升趋势。自2011年第一本相关书籍出版以来,年度图书出版量一直在快速增长。因为图书出版周期长,但仍能长期保持上升曲线,这是大数据理论发展趋势的一个非常重要的证实。

2.2大数据相关关键词的聚类分析

通过对某一研究领域相关关键词的聚类分析,可以了解该研究领域的研究重点和热点,有助于其他研究者准确选择研究方向或相关资源。作者对与大数据相关的关键点进行了统计,统计次数超过300次,如表1所示。

根据统计结果,与大数据最相关的四个关键词是云计算、数据挖掘、数据分析和物联网。这四个关键词的出现频率超过了1000次。这表明这四个方面是大数据研究领域最重要的研究方向。通过对所有热点关键词的分析,可以看出大数据理论的研究重点和热点主要集中在以下几个方面:第一,大数据分析研究,如云计算、数据挖掘、数据分析、海量数据、数据处理等。二是对大数据使用的研究,如电子商务、精准营销、物联网数据应用等。第三是研究与大数据相关的技术和工具,如信息技术、hadoop等。第四是对大数据安全和隐私问题的研究,如信息安全、隐私保护等。根据关键词共现网络图(图3),可以直观地看到这些关键词之间复杂的共现关系。

2.3大数据理论主要研究作者分析

通过研究和分析某一领域核心作者的研究成果,可以了解该领域的最新研究方向和趋势,也有助于研究者更快地找到合作伙伴。作者分别统计了相关作者发表的与大数据相关的论文总数和作为第一作者或独立作者发表的与大数据相关的论文数量。结果如图3所示。

如图4所示,于国铭、杨光、王斌三位作者发表了30多篇相关文章,他们的第一位作者发表了30多篇文章,这表明三位作者在大数据理论研究方面取得了显著的成绩,可以作为该领域的核心研究作者。通过比较每位作者的第一作者发表的文章数量和相关文章的总数,可以看出大多数大作者的两个价值观是不同的,而且有许多不同之处。这表明大数据研究领域的研究者之间存在着良好的合作关系,这种合作关系有利于大数据理论的横向深入研究。

2.4大数据理论重点研究机构分析

某一研究领域的核心研究机构也能反映该研究领域的最新研究方向和趋势。同时,通过分析和综合核心研究机构的研究成果,梳理研究领域的发展轨迹和脉络。作者通过统计研究机构发表的文章数量并按降序排列前10名研究机构,得出表2。

从表2可以看出,武汉大学和中国人民大学在大数据理论研究领域取得了突出的成绩,发表了约300篇文章,可以视为大数据研究领域的核心研究机构。然而,北京大学、清华大学和中国科学院也发表了大约250篇文章。这表明这三个研究机构的研究成果也是杰出的。此外,核心研究机构与核心研究作者的关系非常密切,其中许多人来自核心研究机构,如中国人民大学的于国铭和王斌、中国科学院的张鹏和武汉大学的王伟。

2.5学科分布的聚类分析

大数据理论在许多学科中都有重要的研究价值,在大数据理论研究中,哪个学科更有效是一个值得关注的问题。因此,笔者利用超级明星发现平台和百度学术的学科聚类分析功能对“大数据”进行综合分析。结论是,大数据理论的研究成果在中国图书馆学的四大类中是突出的,即t(工业技术)、f(经济)、g(文化、科学、教育、体育)和d(政治、法律)。比较突出的分支是:计算机科学和技术、应用经济学、信息和通信工程、教育学、图书馆和信息科学以及法律。此外,大数据的跨学科研究也在迅速发展,并产生了许多跨学科主题,[4]具体的研究主题如图6所示。

2.6古典文学分析

每一门学科都有其经典文献,在指导研究者方面发挥着非常明显的作用。虽然目前学术界对经典文学的定义还不明确,但高引用率应该是衡量文学是否经典的一个重要指标。因此,作者使用高被引作品和高被引论文对经典文献进行简单的映射。使用超级明星发现平台和CNKI数据库,与大数据相关的书籍和论文按照引用次数降序排列,前10名被归类,如表3和表4。

根据表3,维克多和肯尼斯的《大数据时代:生活、工作与思维的大变革》和涂梓培的《大数据:正在到来的数据革命》引起了广泛关注,仅在三年内就被引用了500多次。因此,这两本书可以被视为大数据理论研究的经典之作。

与此同时,涂梓培先生拥有两本高被引书籍,这表明涂梓培先生是中国大数据理论研究领域的领军人物。如果你想更快更全面地获得大数据的相关信息,你可以仔细研究他的作品。在被大量引用的书籍中,有4本书是从国外翻译过来的,这表明中国在国外大数据理论的研究方面做了大量的工作。从出版社的角度来看,清华大学出版社有3本书入选。人民邮电出版社有两本精选的书。研究者在选择研究作品时可以更多地关注这两家出版社的书籍。同时,2013年出版的图书占被引图书的80%。因此,近期可以更多关注2013年出版的图书。

从表4的高被引论文列表来看,孟晓峰和他的善意文章《大数据管理:概念、技术与挑战》被引次数超过1500次,远远超过其他论文,可视为该领域的经典论文。这篇论文值得所有研究者仔细研究。从已发表的出版物来看,《计算机学报》有三篇论文入选,这表明该刊关于大数据理论研究的论文质量较高,值得关注。同时,可以看出,大部分被高度引用的论文来自于计算机和软件相关主题的出版物,这也从一个方面证实了大数据在计算机科学技术领域的分布规律。从高被引论文发表的年份来看,2013年也表现突出,经过前期准备,今年论文质量有了很大提高。

结论

自2009年以来,大数据的理论研究引起了学术界的关注。快速发展的趋势始于2011年。云计算、数据挖掘、数据分析和物联网四个研究方向已经成为大数据的研究热点和热点。于国铭、杨光、王彬的相关论文总数和第一作者发表的论文数均明显优于其他作者。因此,他们可以被视为大数据理论研究的核心研究作者。武汉大学和中国人民大学是核心研究机构。大数据理论的研究也取得了巨大的成就。大数据理论的研究在计算机科学与技术、应用经济学、信息与通信工程、教育、图书情报学、法律等领域都有所深化。与此同时,许多交叉学科也出现了。维克多和肯尼斯的《大数据时代:生活、工作与思维的大变革》和涂梓培的《大数据:正在到来的数据革命》是大数据理论研究领域的经典文献,值得认真研究。孟晓峰和好心出版的《大数据管理:概念、技术与挑战》对研究人员也很有用。此外,2013年大数据理论的研究成果,无论是著作还是论文,都取得了显著的成果,应该在该领域引起一段时间的重视。

根据关键词统计分析,虽然大数据的相关研究非常重视计算机科学技术的应用,但是大数据的存储问题和分析工具还没有成为研究的重点,但是作为大数据处理的基本工具的数据存储和数据分析工具应该优先发展,以保证大数据在其他领域的实际应用。[5]同时,由于大数据的广泛应用,这使得信息安全和隐私保护成为一个值得关注的新课题。然而,中国没有相应的法律法规,只能依靠行业自律。这种情况很容易导致大数据应用过程中的数据滥用等问题。因此,有必要把制定相应的法律法规提上议事日程。从经典著作分析可以看出,中国更注重大数据理论框架的构建,而国外更注重技术突破。因此,我们有必要更多地学习国外的先进技术,在理论和应用上共同进步。此外,大数据的出现给数据的价值带来了前所未有的关注,数据的可视化分析也开始进入研究者的视野,这将成为大数据研究的新趋势和热点。

理论研究论文参考资料:

在军事理论论文的最后

文学理论论文

理论月刊

翻译理论与实践论文

大学生军事理论初探

军事理论论文2000

本文的结论是,本文是一篇理论研究硕士学位和学士学位的范文。这也是一篇关于如何免费撰写统计分析、聚类和常用文献的范文,附有相关优秀学术论文题目的参考资料。

上一篇:国庆节作文600字左右70周年(插了我作文600字)

下一篇:带孙悟空来学校作文(孙悟空来我班作文)

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作