概述
大数据
◆ 在信息是大的今天,信息资料存储方式不断方便快捷,存储介质容量不断增大,存储在电脑存储介质中大量的各类信息资料,包括各类视频、音频、图片、文档和数字等,通常把这些存储信息称为“大数据”,对这些数据的综合分析,能使我们能更好的了解事物的规律,使事物的变化向着有利于我们的方向发展。
◆ 数字是:对某事物过程,通过人工记录或仪器检测得到描述事物过程的大量数字。
大数据特点
◆ 数据范围大:如果把数据描绘在两维平面或三维空间,它的范围大。
◆ 数据密度大:每组数据看做一个点,点和点之间的距离小,甚至重合,所以密度大。
◆ 数据变化复杂:因为数据范围大变化无规律,影响因素多,建立数学模型更加困。
◆ 通常,大数据中的视频、音频、图片和文档,我们通过看和听就能理解所表达的含义,但数字不行,它需进行分类比较、图形化和公式化等数据分析挖掘手段,才能直观的看出事物过程的变化和规律。 每个事物过程的结果,都是多种因素的作用造成。当电脑数据库存储了大量的数据后,通过对这些数据的挖掘,找到这些因素和结果数据,利用这些数据建立关系方法,使用方法指导现实决策。
数据规划
◆ 划定分析范围:任何系统过程,都是更大系统的一部分,它本身也包含着一些小系统。对这样得来的大量数据,分析时要根据目的,选择和分析目的相关的数据范围,以这个范围内的数据,做为分析数据。
◆ 确定分析周期:任何系统过程的数据,都是逐时、逐天、逐月和逐年,甚至更长时间积累得来的。以多长时间为分析周期,选几段此周期内的数据,做为分析数据至关重要,选对了事半功倍,选错分析结果错误,造成决策失误。
◆ 明确分析目的: 找到影响因素和目标,通过控制因素使事物过程向着好的方向发展。
◆ 数据图形化。通过数据图形化(直方图、饼图、折线图、模型图等),更直观的了解数据的变化规律。
前景
实验室
实验是研究事物过程因果关系及其变化规律的一种方法,它得到的数据演绎着事物的变化过程,我们把这些数据图形化,做饼图,直方图,折线图或回归成数学模型等,以帮助我们分析了解事物的本质,为解决实际中的问题提供依据。
工程设计
在工程设计中,需要很多复杂的计算,这些计算依赖于试验数据,或以大量实验数据为基础绘制的图表,把这些实验数据或图表回归成数学模型,将计算过程和数学模型编成计算机程序,这样的复杂计算,就会在按几下按键的情况下得出正确的结果。
仪器生产制造
对某物质的某些特性数据的检测,可通过某种手段(如光谱、色谱等)检测出此物质相应数据,把大量的数据和特性数据相关联建成数学模型,就可用某种手段检测出数据和数学模型计算出相应的特性数据值。利用这个方法,可制造出检测仪器。
产品生产控制
产品生产保证质量合格是第一要素,控制影响质量的每一个制造环节尤为重要,在生产过程中,每一段时间每一个环节都有数据记录,通过对这些数据做控制图可以了解生产状态,出现问题时及时调整,以保证质量。也可以通过统计数学等综合分析手段,找出这些环节的因素数据和质量数据的数学算法,用生产各个环节数据通过数学算法计算出质量数据,随时监控质量情况。
系统过程预测分析
系统就是一个环境,这个环境由若干条件因素制约,随着时间的变化条件因素不断变化,系统的结果也随之变化,系统也是更大系统的一部分,同时系统中还有多个子系统。这样的系统存在于我们生活的各个角落,我们需要这个系统变化结果更符合我们的需求,通过条件因素数据可以知道这个系统的发展趋势,也可以通过控制条件因素,使系统变化结果更符合我们的需求,这些都需要数据分析才能实现。
产品
QCC-产品质量控制图
◆ 世界上第一张控制图是由美国贝尔电话实验室(Bell Telephone Laboratory)质量课题研究小组过程控制组学术领导人休哈特博士提出的不合格品率 P 控制图。 随着控制图的诞生,控制图就一直成为科学管理的一个重要工具,成了一个不可或缺的管理工具。它是一种有控制界限的图,用来区分引起的原因是偶然的还是系统的, 可以提供系统原因存在的资讯,从而判断生产过程受控状态。 控制图按其用途可分为两类,一类是计量控制图是供分析用的控制图,用来控制生产过程中有关质量特性值的变化情况, 看工序是否处于稳定受控状态;另一类是计数控制图。,主要用于发现生产过程是否出现了异常情况,以预防产生不合格品。
◆ 控制图是用于分析和判断过程是否处于稳定状态所使用的带有控制界限的图,是具有区分正常波动和异常波动的功能图表,
DRS-数据回归分析
◆ 数据回归分析的目的和意义是将一系列影响因素和结果进行一个拟合,拟合出一个方程,然后通过将这个方程应用到其他同类事件中,可以进行预测。
◆ 统计学中,回归分析指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析; 按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
SPA-系统过程数据分析
◆ 系统就是相对独立的一个范围,它由若干个条件对它作用着,在时间的延续过程中,作用于它的条件不断变化着,使得系统变化成现不同的状态结果。 为了使这状态满足人们的生产生活需要,我们可以对这些条件和结果进行分析,对条件进行控制,以实现这个需求。
◆ 任何系统都是更大系统的一部分,同时它的内部也含有若干个子系统。如众所周知的太阳系是银河系的一部分,同时它的内部又有地球,木星和火星等 九大恒星,它们又和自己的卫星组成有小系统。
◆ 系统无处不在,形式多种多样,也无时无刻的影响着我们的生活,所以,对系统的数据分析处理,有着重大的意义。
交流
DRS
语言:简体中文
大小:34.1 MB
简介:数据回归分析(DRS)是大数据分
析系统中数据回归分析的单行版,是根
据新二乘法编制的。它使得一维和多维
的线性非线性数据回归计算更简单,结
果更准确。
交流SPA
语言:简体中文
大小:36.8 MB
简介:系统过程分析(SPA)是大数据分
析系统中系统过程分析的单行版,它是
对一个系统范围内,各种关系的数据进
行各种分析,建立数学关系并计算的工
具,在实际中有广泛的应用。
交流服务
项目实例:连续自动化生产质量实时监测
在石化生产中,把原料加工成产品,需要通过多种设备控制多点的工艺参数,经过一定的时间才能产 出合格的产品,定时的通过人工采集产品样品,送到实验室检测产品是否合格。从生产控制完成到检验产品是否合格需要很长时间,而且每做一次产品检测 的间隔也很长,所以出现质量检测结果滞后,产品质量很长时间不明的缺陷。我们知道产品的质量是由工艺参数相关的,工艺参数和产品质量数据保存完整,可 以把工艺参数数据和产品质量数据关联成数学算法,通过工艺参数及时不断的计算出产品质量,从而降低成本提高生产效率。
查看详情项目实例:谱图数据再分析
在利用色谱或波长类技术对混合物类样品检测时,通常会得到一系列谱图数据,把数据描绘在坐标系中就 是一条曲线,通过和标样的对比,可以得到混合物中某物质的含量,检测就结束了。但这组谱图数据是混合物某些性质的体现,他和混合物某些性质(如粘度,密 度等)相关,根据这一特性,在对样品检测时,同时对混合物做某些性质(如粘度,密度等)的检测,经过这样的多次检测,可以得到大量的谱图数据和性质数据,用 数学统计学等方法,把谱图数据和性质数据关联成数学算法,再做同样新样品检测时,新谱图数据就可以利用算法计算出混合物的性质。
查看详情关于
荣誉
◆“新二乘法”(最小三乘法)被中国国际交流促进委员会和中国专利技术推广中心,列为2004年全国科技成果、专利技术国际及交流推荐项目。
◆“新二乘法”(最小三乘法)参加了2004年5月20日召开的中国北京国际科技博览会。
◆ 根据“新二乘法”(最小三乘法)开发的数据回归分析软件-DRS,在2011年3月11日举办的第一届香港国际软件大奖赛中,被评为中国软件百强。
◆ 2017年在美国《计算数学和应用杂志》发表了“新二乘法”(New Square Method)论文,论文在国外很多学术网站转载,得到了学术界包括“美国数学学会”和“美国统计学学会”的关注和好评。学术
用户
◆ 中科院大连化学物理所
◆ 天津铁三院
◆ 中国检验检疫科学研究院
◆ 中山大学
◆ 四川省消防产品质检站
◆ 西南石油大学
◆ 北京科技大学
◆ 哈尔滨工业大学
◆ 北京大学遥感所
◆ 浙江大学
◆ 内蒙古大学
◆ 天津大学
◆ 重庆大学