烟草大数据系统建设探讨
2018年06月07日来源:烟草在线作者:孙涛

  烟草在线专稿  

  一、什么是烟草行业大数据系统

  烟草行业大数据系统基础是大数据收集、存储和使用,同时又高于一般的大数据系统。首先基础是大数据,烟草行业大数据系统的基础是行业各个终端汇集的大量数据,数据是系统运行和产生收益的基础。其次,功能高于一般的大数据系统,在大数据中心采集数据、存储数据的基础上,结合人工智能系统、云计算技术,通过深度学习、人工智能神经网络引擎来挖掘烟草行业庞大的数据资源,为行业发展提供云数据支持的数据处理系统;同时也是为其他企业提供云数据支持,获取相关利润的云计算平台。

  二、烟草行业建立大数据系统的意义

  一是利用大数据系统整合全行业信息

    烟草行业具有众多的数据终端,全国众多的卷烟零售户,卷烟消费者,烟草工业企业,烟草商业企业,烟叶生产企业都是信息采集终端,通过合理整合,可以每时每刻采集到大量优质数据信息。

  二是大数据系统是现代化集团企业的神经网络中心

    现代化企业的发展,神经网络系统的建立是个必然趋势,它使得行业上下游企业,消费者,零售终端都通过数据、网络形成一个信息快速传递的整体。神经网络的建立,将有利于快速响应市场需求,提供定制商品,订单化制作,智能化生产等现代化企业功能。

  三是打破工业、商业、物流、烟农、烟叶企业、零售户、消费者界线,构建大烟草,形成合力

    通过大数据系统的建立,将有效打破各企业,消费者,零售户之间的界线,互通有互,互惠互利,各种信息将无碍传递,最终形成一加一大于二的联合效益。

  三、烟草行业大数据系统初步展望

  1、大数据中的数据类型和基本应用

    用户在烟草行业的手机APP或者网站上点鼠标购买商品,输入文字、通过语音都可以发表意见,这些都是数据,就可以将其中的信息提取出来,变成大数据,输入大数据系统,来指导实践、形成智慧,让客户爱上烟草APP,不想离开,不停地购买各种烟草制品。买了A又推荐B,客户就说,“B也是很好的烟啊,我喜欢!”。这个大数据系统就拥有了智慧。

  2、数据处理

  原始数据中有很多垃圾数据,需要清洗和过滤,才能成为高质量数据,从而进行分析、分类,总结数据之间的规律,得到知识。第五个步骤是对于数据的检索和挖掘。检索就是搜索,是将分析后的数据放入搜索引擎,想寻找信息的时候,一搜就有了。另外就是挖掘,仅仅搜索出来已经不能满足人们的要求了,还需要从信息中挖掘出相互的关系。通过各种算法挖掘数据中的关系,形成知识库。

  3、大数据时代,需要建立服务器集群

  当数据量越来越大,就要聚合多台机器的力量,建立服务器集群。利用服务器集群的超强算理,通过网络爬虫,搜集各种烟草相关的信息。利用分布式队列来应对大量数据的传输:大量的数据需要基于硬盘的分布式队列,这样队列可以多台机器同时传输,足以应对大量数据传输。采取分布式文件系统存储大量数据:建立一个分布式文件系统,可以利用硬盘阵列,结合多台机器建立大的文件系统。采取分布式计算分析大量数据:对大量的数据做分解、统计、汇总,采用分布式计算的方法,将大量的数据分成多个部分,每台机器处理一部分,多台机器并行处理。

  烟草行业可以依托自己强大的资金实力,建立具有强大硬件设施的数据处理中心,作为行业云计算中心,除了为行业本身服务,也可以为其他企业提供云计算服务,从而扩展利润,扩大业务。

  四、烟草行业大数据系统是大数据、云计算和人工智能的完美结合

  1、烟草行业大数据系统是智能化的数据引擎

    烟草行业的大数据系统,将人工智能和数据搜索结合,提供客户最想要获取的搜索信息。根据客户的信息和要求,智能推荐客户想要的,就像朋友一样,懂得客户需求。

  2、烟草行业大数据系统是具有推理功能的数据系统

    烟草行业数据系统将根据各种卷烟品牌的市场销售数据和消费者反馈信息,智能推算未来一个时期的产品销售数量,以此来指导工业企业和烟叶种植企业的生产数量,防止出现库存、积压等资源浪费行为,最大幅度的提升生产效率。能够根据市场反应和消费者提供的信息,推理出最适合市场需求的新品卷烟的外包装和新品卷烟配方,更加适合市场的未来发展方向。

  3、烟草行业大数据系统是具有自我学习功能的智能系统

  通过机器超强的统计能力和模拟人类大脑的学习能力,可以自动进行自我学习。通过用数学单元模拟神经元,这个神经元有输入,有输出,输入和输出之间通过一个公式来表示,输入根据重要程度不同(权重),影响着输出。于是将n个神经元通过像一张神经网络一样连接在一起。n这个数字可以很大很大,所有的神经元可以分成很多列,每一列很多个排列起来。每个神经元对于输入的权重可以都不相同,从而每个神经元的公式也不相同。最后通过多重运算,得出结果。

  4、烟草行业大数据系统可以有效支持人工智能的实现

  企业神经网络包含众多的节点,每个节点又包含非常多的参数,整个参数量非常大,需要的计算量也大。可以利用行业的大数据平台,汇聚多台机器的力量一起来计算,就能在有限的时间内得到想要的结果。人工智能功能强大,例如可以根据客户神情鉴别客户对产品的满意度,鉴别客户身份,搜集客户意见,智能提醒客户存款、订购等。以上功能都基于大数据和人工智能,从而进行更加精准的用户画像、语音识别。文本理解和图像理解。由于人工智能算法的基础就是大量数据,烟草行业具有庞大的客户群和遍布全国的工商企业,这些终端都能够产生大量数据,这些数据还能够进行长期的积累,结合人工智能算法,经过相关数据训练,就可以产生大数据效益。就是作为云计算厂商也是能够达到要求的,利用烟草行业积累的大量数据,设计一个服务接口,就可以直接提供在线服务了。这种形势的服务,在云计算里面称为软件即服务,这是人工智能、大数据、云计算的最佳结合。

  五、大数据系统的重中之重--数据安全

  大数据系统的安全工作是重中之重,为了确保数据安全,应尽力做到以下方面:

  聘用专业技术人员,网络安全,数据安全是专业性很高的技术工作,企业应专门配置网络安全人员,招聘行业中有经验、有技术的专业优秀安全人才。

  与专业网络安全企业合作,网络安全技术日新月异,为了确保数据安全,在配备专业安全技术人员的基础上,还要积极和网络安全专业公司开展合作,获得他们的技术支持和安全策略。

  建立科学可行的数据安全制度,网络安全和数据安全有其特殊性,要针对其特点制定安全制度,并坚持执行。

  及时升级安全设备。网络安全除了软件外,硬件设备也非常重要,为了应对日益严峻的网络攻击,应定期升级网络和数据安全软、硬件,防止出现黑客入侵,病毒破坏等现象。

猜你喜欢
频道热搜文章