发布时间:2023-09-22 10:39:04
导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的5篇网络行为审计范例,将为您的写作提供有力的支持和灵感!
作者简介:钟阳(1982―),女,满族,黑龙江哈尔滨人,吉林大学经济学院博士研究生,主要从事国际金融研究;丁一兵(1973―),男,湖北武汉人,吉林大学经济学院教授,博士生导师,主要从事世界经济、国际金融研究;何彬(1979一),男,云南昆明人,吉林大学国有经济研究中心博士,主要从事应用计量经济学、公共经济学研究。
中图分类号:F821.0
文献标识码:A
中图分类号:TN911.23 文献标识码:A
1 引 言
目前,室内定位算法主要有以下几种。
1)Time of arrival(TOA)
TOA定位的基本原理是通过测量节点间电波传播的时间来确定节点的位置。
TOA算法要求参加定位的各个基站在时间上实现严格同步。在室内环境中,由于已知点到待测点的距离通常不远,无线电波的传播速度太快,且存在严重的多径干扰,因此无法利用无线电波进行测距。目前,基于TOA的室内定位技术通常是利用超声波传播速度较慢的特点(在20摄氏度时超声波的传播速度为343.38m/s),来测量出已知点和待测点间的距离,进而求出待测点的位置[1]。
2)GPS L1 Re-radiating
GPS(Global Positioning System)是70年代初由美国开发的卫星导航定位系统,本质上它也是一个基于TOA的定位系统。
GPS L1 Re-radiating是将GPS在L1频段上的信号,通过户外天线接收后,增益放大为室内可接收信号,进而基于GPS实现室内定位。
3)Received signal strength,RSS
RSS定位的基本原理是利用移动装置侦测所接收到的无线电波信号强弱,然后根据经验模型或RSS随距离衰减的模型来推断节点间的距离,进而实现定位[2]。
该技术主要使用无线网络本身的无线电信号来定位,不需额外添加硬件,是一种低功率、廉价的定位技术[3]。
基于信号强度的室内定位方法分为经验模型法和信号衰减模型法。
(1)经验模型法
在经验模型法中,将RSSI数据转换为位置信息的方法主要有判定法和概率法两种。
(2)信号衰减模型法
信号衰减模型法则无需实地测量位置和RSSI,而是依据信号强度和距离的特定关系,结合三角测量法,根据来自三个(或以上)AP的RSSI来计算出待测点的位置。
基于TOA的定位模型在开放的室外环境中非常有效,但在室内环境却存在一些问题。使用超声波虽可克服无线电波传输速度快的问题,但需构建专门的超声波系统。GPS也主要是针对户外目标设计的定位系统,应用于室内存在定位精度不高等问题。基于RSS的定位模型中,经验法需进行大量的实地测量,同时无法保护定位用户的隐私;而信号衰减法在室内受NLOS(非视距传播)等因素影响,也使得定位精度较低。
因此,本文提出了一种基于BP神经网络的室内定位模型并借助MATLAB 7.0加以实现。采用该方法进行室内定位,不需要WLAN以外的其他资源。由于不需要知道定位节点和建筑物的详细特性,用户的隐私将随之得到完全的保护。
2 基于BP神经网络的室内定位模型
BP神经网络通常是指基于误差反向传播算法(Backpropagation)的多层前向神经网络,目前,该算法已成为应用最为广泛的神经网络学习算法[4]。
BP神经网络采用的是并行网络结构,包括输入层、隐含层和输出层,经作用函数后,再把隐节点的输出信号传递到输出节点,最后给出输出结果。该算法的学习过程由信息的前向传播和误差的反向传播组成。在前向传播的过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。第一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望的输出结果,则转入反向传播,将误差信号(目标值与网络输出之差)沿原来的连接通道返回,通过修改各层神经元权值,使得误差均方最小。神经网络理论已经证明BP神经网络具有强大的非线性映射能力和泛化功能,任一连续函数或映射均可采用三层网络加以实现。
计算技术与自动化2007年6月第26卷第2期李 瑛等:一种基于BP神经网络的室内定位模型2.1 样本数据的采集和处理
输入向量为待测点收到的来自至少三个不同位置AP的RSSI值,输出向量为待测点的坐标值(X,Y)。
样本采集在一个10mX10m的室内场地中进行。使用3个来自SMC公司的AP和1台配置了ORiNOCO PC CARD的笔记本电脑。AP及无线网卡符合并工作在IEEE 802.11b标准下。笔记本电脑所使用的操作系统为RedHat Linux 9.0。样本均匀分布在6mx6m的中心区域中。
2.2 网络结构的确定
Kolmogorov定理已经证明[5],任意一连续函数可由一个三层BP 网络来实现。虽然研究表明三层以上的BP网络可以减少隐含层节点数,提高计算效率,但在缺乏理论指导的BP网络设计中这样做容易使问题趋向复杂化。因此选择三层BP神经网络,即只有1个隐含层的BP神经网络。
该网络输入层的节点数由输入向量的维数决定,输入向量的维数是3,所以输入层节点数确定为3个。输出层节点数由输出向量的维数决定,这里输出节点数为2 。
隐含层节点数的选择在BP网络设计中是一个难点,目前还没有理论上的指导。过多的网络节点会增加训练网络的时间,也会使网络的泛化能力减弱,网络的预测能力下降。然而网络节点过少则不能反映后续值与前驱值的相关关系,建模不充分。经反复试验,将隐含层节点数定为30,这样形成了一个3-30-2结构的BP神经网络,如图1所示。
2.3 学习算法的选择
基本BP 算法采用梯度下降法使得误差均方(mse)趋向最小,直至达到误差要求。但在实际应用中,存在收敛速度慢、局部极值等缺点。Matlab 7.0神经网络工具箱中提供了十多种快速学习算法,一类是采用启发式学习方法,如引入动量因子的traingdm 算法、变速率学习算法traingda 、“弹性”学习算法trainrp等;另一类采用数值优化方法,如共轭梯度学习算法traincgf 等。本研究选择traincgf 算法。该算法在不增加算法复杂性的前提下,可以提高收敛速度,并且可沿共扼方向达到全局最小点,较好地解决了经典BP算法所存在的收敛速度慢和可能出现局部最优解的问题。
2.4 BP神经网络的初始化、训练与仿真
1)建立网络
net==newff(P3,[30,2],{′tansig′,′purelin′},′traincgf′)
newff()为建立BP 神经网络的函数;P3为6维矩阵,表示3维输入向量中每维输入的最小值和最大值之间的范围。[30,2]表示隐层节点数是30,输出层节点数是2,{′tansig′,′purelin′}表示隐含层中的神经元采用tansig转换函数,输出层采用purelin函数,′traincgf′表示选择的学习算法。
2)权重和阈值初始化
net==init(net)
给各连接权重LW{1,1}、LW{2,1}及阈值b{1}、b{2}赋予(-1,+1)间的随机值。
3)训练
[net,tr]=train(net,P,T)
P为输入向量,T为目标向量,根据网络学习误差逆传递算法,利用阻尼最小二乘算法迭代,由前一次训练得到的网络权重及阈值训练得到新的网络权重及阈值。
为了使生成的BP网络对输入向量有一定的容错能力,最好的方法是既使用理想的信号又使用带有噪声的信号对网络进行训练。具体做法是先用理想的输入信号对网络进行训练,直到起平方和误差足够小;然后,使用20组理想信号和带有噪声的信号对网络进行训练。经过上述训练后,网络对无误差的信号也可能会采用对付带有噪声信号的办法,这样会导致很大的代价,因此,需要采用理想的向量对网络再次训练,以保证网络能对理想信号作出最好的反应。
使用函数traincgf对网络进行训练时,当网络平方和误差小于3时停止网络的训练。训练过程中的误差变化情况如图2所示。
根据训练后的网络及输入向量进行仿真输出。
3 实验结果及分析
利用训练后的BP神经网络进行了36次定位,并统计了36次定位的平均误差,结果如图3所示。
与利用信号衰减模型定位相比(如图4所示),利用BP神经网络定位具有更高的统计精度。
与信号衰减模型相比,虽然BP神经网络的模型解释直观性略有不足,但却可获得更精确的定位结果。
利用BP神经网络,虽然可解决传统处理方法所不能处理的非线性映射问题,但在实际应用中,对如何选择和确定一个合适的神经网络结构没有确切的理论指导,只能通过试验―调整―再试验的过程来确定一个合适的网络结构。同时,BP神经网络的隐含层作用机理和隐含层节点个数的选择是BP神经网络的难点问题。隐含层的节点个数的选择需反复进行试验,当多次输出结果在一定误差范围内时才可确定。
4 结束语
1、人工神经网络
人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。
2、基于人工神经网络的预测模型的构建
在运用ANN预测模型预测这两个指标时,我们采取下面的预测步骤:
(1)首先将1-6月份的数据标准化,及转化为0-1之间的标准化数据;
(2)我们将输入设为1月份、2月份、3月份、4月份的数据,输出设为5月份的数据;
(3)在matlab中调用newff函数,建立一个5个输入节点、10个隐含层节点、一个输出节点的BP神经网络,隐含层和输出层转移函数分别采用tansig(tansig(n) = 2/(1+exp(-2*n))-1)和purelin(y=x),训练函数选择贝叶斯正则化算法trainbr,得到网络仿真数据;
(4)通过得到的网络仿真数据与实际的数据进行比较,我们可以发现该预测模型的精度很高。从而我们可以利用该预测模型预测未来月份的数据,作为决策者进行决策的依据。
3、分规模企业运行态势预测模型
3.1中型企业运行态势预测模型
我们按照上述步骤,得到最终的预测值,如表1所示,可见,预测值与实际值之间相差并不大,误差为0.099973%。
表1运行监测指标按规模(中型)ANN预测模型实际值与预测值对比表
3.2小型企业运行态势预警模型
我们按照上述步骤,得到最终的预测值,如表2所示,可见,预测值与实际值之间相差并不大,误差为0.099974%。
表2运行监测指标按规模(小型)ANN预测模型实际值与预测值对比表
3.3微型企业运行态势预警模型
我们按照上述步骤,得到最终的预测值,如表3所示,可见,预测值与实际值之间相差并不大,误差为0.098246%。
表3 运行监测指标按规模(微型)ANN预测模型实际值与预测值对比表
4、结束语
运行监测指数和信心指数能很好的反映成都市中小企业的发展运营情况,本报告运用人工神经网络这种高精度的预测方法,对这两种指数进行了预测,预测结果精确,经济意义显著。能很好预测未来月份的中小企业的指标值,从而为决策者的决策提供有力的支持和依据。
参考文献:
基于现有的各类财务指标,构建一个财务危机预警的数学模型,用于提示企业发生财务危机的可能性有很多现实意义。建立与企业实际发展状况相符的财务危机预警模型有利于投资者做出更加理智的投资决策,有利于企业管理者更好地理解企业财务状况以提高管理水平,有利于银行和其他债权人更好地评估企业的债务违约风险,有利于政府监管部门更有针对性地监督上市公司,有利于审计人员更加高效地审计上市公司等等。
二、选择样本
失败企业的筛选:
在第一部分,将“ST”企业定义为经营失败的企业,数据来自于上海证券交易所和深圳证券交易所网站。由于有些失败企业数据缺失,最终筛选出2005年的55家“ST”企业。为了将模型适用于各类企业,这55家“ST”企业来自各行各业,有制造业、建筑业、交通运输业等。资本市场中,大部分企业使用统一的会计制度,但是金融保险业上市公司使用其专有的会计制度,因此,本文挑选的55家“ST”企业不包括金融保险业上市公司。
非失败企业的筛选:
非失败企业的筛选按照以下步骤进行:(1)查找“ST”公司的行业类别代码;(2)在该类行业中,筛选出和“ST企业”资产规模最接近的企业;(3)如果筛选出的企业是非失败企业,则采用;(4)重复以上步骤,直到筛选出与失败企业同样数量的非失败企业。
表 失败企业和非失败企业的来源与数量 单位:家
三、选择财务指标
目前,通过哪些财务指标来判断企业是否遇到了财务危机没有一个统一的标准,而且仅仅通过若干个财务指标来描述企业的经营状况是很困难的。本文在前人研究经验的基础上,初步筛选出反映企业总体状况的六个方面的15个财务指标,这六个方面分别是短期偿债能力,长期偿债能力,盈利能力,资产管理能力,主营业务盈利能力和增长能力。筛选的15个财务指标来自2005年12月31日的资产负债表,主要有流动比率,速动比率,现金比率,产权比率,已获利息倍数,现金收入比率,总资产收益率,净资产收益率,存货周转率,应收账款周转率,总资产周转率,主营业务利润率,资本保值增值率,净利润增长率,总资产增长率。
在建立预测模型之前,首先要在15个财务指标中找出与企业被“ST”最相关的指标。在Rapidminer 6.1中,使用相关矩阵测算财务指标与“ST”之间的关系。通过计算,除去流动比率(相关系数为0.03
图1
使用Rapidminer 6.1的相关矩阵函数计算找出与企业被“ST”最相关的财务指标,软件中使用的模块和连接如图中所示。
图2
展示了13个财务指标分别与企业被“ST”之间的相关系数,运行结果显示,财务指标X1(流动比率)和财务指标X3(现金比率)与“ST”的相关系数小于0.05,表明他们之间的相关性小,因此剔除这两个财务指标。
四、实验过程
神经网络的建模过程如图3、图4所示,图5表示的是预测的准确率。
图3 主要处理过程
将待处理数据和SPLIT函数模块拖入主界面,将两个模块连接,SPLIT函数模块的作用是将待处理数据随机分割成两部分,设定分隔系数是0.7,即70%的财务数据用作训练数据,30%的财务数据用作检验数据。
图4
将导入主界面的全部数据中的70%,即导入77家上市公司的财务数据,使用神经网络模型进行训练,训练完成的神经网络模型用于对剩余30%的数据即33家上市公司的财务数据进行预测,预测这33家上市公司中失败企业(即“ST”上市公司)的数量和非失败企业(即正常上市公司)的数量。
图5
11月15日、16日两天,央视“新闻30分”栏目以《记者调查:虚假信息借网传播百度竞价排名遭质疑》、《记者调查:搜索引擎竞价排名能否让人公平获取信息》为题,极为罕见地连续两期对百度进行了揭秘报道。报道称,由于愿意出较高价格购买关键词,例如,一些非法医疗网站在百度搜索结果中的排名位列推荐位置,而一些网站由于没有资金购买关键词惨遭屏蔽。央视的打击目标直指百度的核心商业模式――搜索引擎竞价排名。
此前,百度以互联网黑马的姿态屡次创造业界神话。2005年8月5日,百度上市首日股价冲破100美元,股价涨幅高达354%,市值达到39.58亿美元,市盈率一度高达2450倍,成为华尔街万人追捧的绩优股。2003年6月,美国第三方权威统计机构Alexa统计表明,百度成为全球最大的中文搜索引擎。
曾几何时,笼罩在百度头上的光环散去,官司缠身、投诉不断、媒体曝光令百度应接不暇,“点击欺诈”、“暗箱操作”、“危机公关”、“暴力营销”等负面新闻与百度如影随形。如今,百度关键词竞价东窗事发,沉重打击华尔街投资人信心,花旗、摩根斯坦利等分析机构相继调低了对百度的评级和未来营收预期,百度股价应声而跌,连续4日跌幅近40%。以市值计算,百度在短短4天之内市值缩水超过120亿美元。
百度何以在一夜之间失宠于业界?会不会就此成为互联网上的“三鹿”?
网民揭批百度“舞弊黑幕”
一家名为“反百度联盟”的网站负责人表示:众多网民以及中小网站对百度的质疑和不满由来已久,只不过,惮于后者绝对强势的网络话语权势,难以发出自己的声音。央视此次戳破了脓疮,作为互联网中文强势引擎的百度沉淀已久的暗黑面悉数暴露无遗。媒体和公众对百度的质疑主要集中在环环相扣、互为表里的四个方面:
存在欺诈虚假网站信息。据央视报道,从去年开始,国家食品药品监督管理局对违法网络售药行为进行了严厉打击,但在百度搜索引擎上仍可搜索到大量宣称特效治疗癌症等疾病的非法药品网站,并且这些药品中绝大多数都是没有取得国家药准字号的。据报道,对于参与竞价排名的虚假网站,百度个别工作人员非但没有进行严格审查,甚至还帮助他们弄虚作假,蒙混过关。
人工干预搜索结果。据知情人士表示,当传统媒体有负面新闻时,百度可以通过屏蔽相关内容获得广告,也可通过置顶等操作放大负面效果,让广告主上门讨饶。两周前,一份据称来自百度内部的汽车营销PPT方案在网上曝光,该方案特别推荐了百度的“增值服务”――公关监控和危机公关,鼓励用户“花钱免灾”,只要用户支付足够的钱,百度就可以替客户屏蔽搜索引擎上针对客户的负面报道。此前,三鹿奶粉事件曝光后,三鹿御用公关公司试图用300万元换取百度删除负面新闻,虽然百度对此一概否认,但此公关事件的曝光却令百度身陷道德危机。
涉嫌组织网络黑社会性质的勒索营销。批评者指出,百度帮主李彦宏俨然成了互联网时代的“老大哥”,他所率领的“真理部”借助技术垄断优势,操控了互联网话语权,把所有拒绝合作或者反对它的网站以“垃圾信息”为由直接屏蔽。这一举措引发了公众对搜索引擎信息公平性与商家商业道德的普遍质疑。一位不愿透露姓名的站长向记者表示:“只要你参与了百度的竞价排名,然后退出了这个游戏,你就会发现你的网站从此在百度上消失了。”百度华南商证实了这一说法。在几家门户网站针对网民的调查中,80%以上的网民表示“遇到过网站被百度封杀的案例”。
广告与搜索结果混淆。在业内流传着一个冷笑话:许多用户在百度上搜索资料时,会直接点到最后一页,然后往前倒过来搜索结果,因为第一页几乎是竞价排名的结果,百度排列信息的重要性和相关性标准是与广告主的现金挂钩,而不是同信息有效性本身挂钩。网友发现,随着参与竞价排名的厂商越来越多,用户查找需要的信息变得越来越困难。业内专家指出:关键词竞价排名,作为一种搜索引擎特有的网络广告,客户花钱,网络商通过特定的方式加以体现和推广的手段,其本身无可厚非,包括Google在内,许多搜索引擎也都以不同方式接纳商业广告,这是搜索引擎最重要的盈利途径。然而百度的最大问题在于鱼目混珠的操作方法,将付费广告同正常信息相混杂,甚至直接用付费广告顶替正常信息。相反,Google则明确将合作伙伴商业广告放置在搜索结果的右侧,使用者一目了然,根本不会将两者混为一谈。
批评者指出,上述一系列手段成了百度核心竞争力和屡试不爽的秘密武器。
业界呼吁信息搜索标准透明
其实,百度这些“罪状”都是表象,所有争议的焦点和问题的症结在于如何确定、谁来确定搜索结果的标准。
拿 Google 来说,其核心搜索标准是 PageRank (页面评级),一个页面被链接的数量(反向链接)越多,被推荐越高。这样的搜索结果由第三方客观因素决定,透明、简单而清晰。虽然 Google 的“良好用心”也常常被部分“聪明”的站长恶意利用,但是根子还是端正的,利多弊少。
而百度的搜索标准却复杂到只有百度自己才能理解。一个网站是否被“信息垃圾”的标签屏蔽,全部由百度这个裁判说了算。到底什么是有用信息,什么是无效信息?它们之间的区别和尺度在哪里?如果裁判裁决的主要依据不是职业操守加上专业经验,而是球队进贡的数量,“黑哨”就不可避免。“没有被收进来那肯定是你自己有问题”,正是这种标准的主观性、随意性,支撑了百度的全部商业模型――关键词竞价,客户出钱的多少决定了信息的价值,决定了它的排位,以及它可以在网民眼球中的位置。分析人士指出,百度首先操控了标准,才得以把客户作为绑架的“肉票”,才能把千千万万网民玩弄于股掌之间。