基于大数据的国际航班价格预测模型研究-赵明莉.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于大数据的国际航班价格预测模型研究-赵明莉.pdf》由会员分享,可在线阅读,更多相关《基于大数据的国际航班价格预测模型研究-赵明莉.pdf(56页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、分龚号U D C密级蟹开 暑囊;l产篝。硕士研究生学位论文基于大数据的国际航班价格预测模型研究申请人:赵明莉学 号:2150106培养单位:数学科学学院学科专业:应用统计研究方向:火数据分析指导教师:王楠完成日期:2017年6月l口万方数据分类号一U D C密级鍪开舅翥声夕擎硕士研究生学位论文基于大数据的国际航班价格预测模型研究申请人:赵明莉学 号:2150106培养单位:数学科学学院学科专业:应用统计研究方向:大数据分析指导教师:王楠完成日期:2017年6月1日撩陟,蓑进篓:譬弋万方数据中文摘要中文摘要随着社会的快速发展以及人们生活水平的提高,旅游已经逐渐成为了生活的必需品,机票是旅游产品中
2、必不可少的一个环节。机票价格是旅游大数据领域研究的一个重要内容,机票价格是随着市场销售情况动态变化的,如果某个航班销售的好航空公司会涨价,相反,如果航班销售不好航空公司就会开舱降价。此外,各航空公司之间除了通过价格竞争获取客源之外,航空公司之间还同时签订价格保护协议,例如起飞前3天内的价格不低于8折销售等。因此,航班的价格变化是一个十分复杂的问题,对于价格的预测有着相当大的难度,与此同时价格预测技术有着巨大的商业应用前景和市场价值。本文从数据挖掘的角度分析了基于大数据技术对于机票价格进行预测的可行性,尤其是国际航班的机票价格预测的可行性。首先,本文阐述了大数据理论的发展和大数据研究的关键技术,
3、基于大数据的数据挖掘方法及其应用。针对所研究的问题还阐述了旅游大数据的定义、旅游大数据的发展概况以及旅游大数据中航班价格变化的历史积累对于航班价格预测所起到的作用。其次,本文对国际航班价格预测模型中所要应用的人工神经网络模型进行了介绍,说明了人工神经网络基本原理、人工神经网络特点、BP神经网络,重点介绍了最近流行的基于大数据的深度学习网络模型。本文建立了基于大数据和人工神经网络的国际航班价格预测模型,并利用该模型对于真实的国际航线北京到巴黎(PEKCDG)的航班在日期2017年3月13日至2017年4月24日的价格数据进行了详细的分析和预测。通过计算机系统自动采集航线、航班的价格变化数据,从2
4、016年11月至2017年2月,系统每6小时一次进行数据采集,累计采集该航线数据4万余条。本文以大量的真实历史数据作为训练样本,对神经网络模型进行训练,然后利用训练后的模型对实时的航班价格进行预测,模型预测的结果与实际情况进行对比分析,总体上模型是有效的,模型预测准确率可以达到70左右。该模型的研究工作有重要的实践意义和良好的应用前景,且该模型还有继续研究和改进的空间。关键词:大数据;数据挖掘;机器学习;人_rio经网络;MATLABI一万方数据黑龙江大学硕士学位论文AbstractWith the rapidly development of society and the improvem
5、ent of peopleS livingstandards,tourism has gradually become a necessity of lifeAt the same time,airtickets are an indispensable part of tourism productsTickets price is an importantelement of tourism,which is changeable with the market salesIf a flight sells well,the airlines will increase its price
6、,on the contrary,the airlines will cut the priceFurthermore,the airlines will sign a price protection agreement in addition to pricecompetitionFor example,the price within 3 days before takeoff should not be lessthan 20offTherefore,flightS price changes is a very complex issue and it isrelatively di
7、fficult to forecastAt the same time,price forecasting technology has ahuge market and a very good prospectIn this paper,we analyze the feasibility of forecasting the tickets price from theperspective of data mining,especially the tickets price forecasting of internationalflightFirstly,we describe th
8、e development of big data theories,the technology ofbig data,the data mining method and application based on big dataMoreover,we also elaborate the definition and development of tourism big data)the influenceof flight price changes on the forecast resultsSecondly,we introduce the artificialneural ne
9、twork model that applied in the international flight price and explain thebasic principles and characteristics of artificial neural networkFinally,we focuson the deep learning network model based on big data,which is popular in recentyearsIn our method,we establish an international flight price fore
10、casting modelbased on big data and artificial neural network,and use it to analyze and forecastthe price of real international airline that from Beijing to ParisThe computersystem automatically collected data every 6 hours from November 20 1 6 to February2017,then forty thousand historical data were
11、 collectedIn this paper,we use alarge number of real historical data as training samples,and then use the trainedmodel to predict the realtime flight pricesWe compare the results of the modelprediction with the real situation,and the results show that the model is effective一TT万方数据AbstractFrom the re
12、sults,we can see that the model accuracy rate can reach about 70Onthe whole,the research of this model has important practical significance and it hasa great improvement spaceKeywords:big data;data mining; machine learning;neural network;MATLABIII万方数据黑龙江大学硕士学位论文目录中文摘要 IAbstract II目录IV第1章绪论 111研究的背景
13、112研究的内容 213研究的方法 214本章小结 3第2章大数据及数据挖掘理论 521大数据概念及相关技术 5211大数据的理论 5212大数据的关键技术 522数据挖掘理论 7221数据挖掘概述 7222数据挖掘过程 8223数据挖掘算法 9224国内数据挖掘的发展现状1123常用数据分析软件介绍11231 SQL11232 MATLAB 12233 R语言1424本章小结15第3章基于大数据的人工神经网络模型1631人工神经网络的基本原理16311人工神经元模型16一TV万方数据目录312激活函数313人工神经网络的特点32 BP神经网络321 BP神经网络的概述322 BP神经网络的核
14、心算法323 BP神经网络的算法改进33基于大数据的深度学习网络模型34本章小结第4章航班预测模型的建立及其算法实现41神经网络预测模型训练数据的获取及预处理411数据获取412缺失值的处理方法42基于神经网络的预测模型421神经网络模型的设计422神经网络模型的训练与预测423基于MATLAB软件的预测模型实现及结果分析43模型的实际应用44本章小结总结及展望参考文献致谢独创性声明78999345666022568l23891111122222233333344444万方数据第1章绪论11研究的背景第1章 绪论人们的生活水平曰益提高,外出旅行得到越来越多人的青睐。由于飞机具有速度快、用时短的
15、特点,坐飞机出行成为了越来越多人的首要选择,而机票的价格变化也成为人们关心的一个话题。此外,互联网行业的兴起,不仅使网上订票更加方便,而且使机票预订的各种数据也在爆炸式增长。互联网行业的崛起、大数据时代的来临使得我们获取数据更加便捷,大量的真实数据为我们研究机票的价格变化提供了基础,而这种价格波动是有规律可循的,特别是对于国际航班,这种规律会更加明显。对于机票价格的变化规律,人们普遍认为,距离起飞时间越近,价格可能会越高,提前多天的时候进行订票价格可能会更便宜。然而实际大数据的研究显示并非距离起飞时间越近,价格越高,有的航班距离起飞时间越近反而价格会降低,造成这种情况的原因有很多,比如航班客座
16、率低、相关航班的价格竞争等等多种偶发因素,且这种偶发并非偶然现象。我们经过对比发现航班在起飞前15天价格的波动比较明显,距离离港日期30天内的价格变化趋势见图1-1,在这个时间段对航班价格波动进行准确预测有着关键意义。t I,S7InH HuN”n抖再抖F,一ll邮椭幽prm恤图11:价格趋势Figure 1-1 Ticket price trends一1一万方数据黑龙江大学硕士学位论文12研究的内容本文主要是研究如何基于航班价格变化的海量数据运用BP神经网络方法从机票历史记录信息中挖掘出票价波动的规律,并用此方法对新的数据进行预测分析。本文的主要的研究内容有如下三个方面:大数据理论、样本数据
17、处理以及基于神经网络的票价预测模型。(1)大数据理论:由于大数据还没有固定的定义,所以本文主要是详细阐述了不同的人,不同的领域对大数据的多种定义以及大数据的3V、4V以及发展到目前5V特征分别代表的含义,并进一步研究了大数据的相关技术理论。(2)样本数据处理:样本数据处理的主要目的就是在尽可能保证样本有效信息量的情况下,减少无关的数据,填补缺失的数据等,从而提高数据的质量,为下一步的数据挖掘做准备。(3)基于神经网络的票价预测模型:本文主要是基于大量的真实航班历史数据通过BP神经网络方法进行建模,分析出机票价格变化的规律。首先,研究了在选取训练集和测试集的时候不同的抽样方法随机抽样和boots
18、trap抽样对模型预测准确性的影响。然后,本文又研究了不同神经网络训练参数取值对预测结果的影响。由于神经网络模型的参数比较多,本文综合考虑了BP神经网络预测模型的多个参数,如学习率,训练次数,目标误差,隐层神经元的个数等,通过不断的调整参数的取值,找出模型预测准确率比较高的参数值。13研究的方法论文主要研究的问题是基于大数据的国际航班价格预测模型。我们已经知道国际航班机票价格的波动规律是比较明显的,如何在海量的真实数据样本中挖掘出我们感兴趣的、对我们有意义的规律是我们需要研究的。本文具体的研究过程可以分为四个阶段:数据处理阶段、划分训练集和测试集阶段、模型建立阶段以及结果分析阶段。在数据处理阶
19、段本文主要是用常数填补法处理缺失值;在划分训练集和测试集阶段主要是用随机抽样的方法选取训练集和测试集;在模型建立阶段,主要是用BP神经网络进行模型的建立;在结果分析阶段主要是用可视化分析技术对结果进行展示。一2一万方数据第1章绪论在数据处理阶段,本文从实际问题和需求出发,通过与企业的合作获得大量的航班历史数据,以大量的真实的航班历史数据作为数据分析的样本,但真实数据往往存在缺失值问题。在综合考虑真实数据的缺失类型后,在诸多处理缺失值数据的方法中,本文选择了常数填补法。在选取训练集和测试集阶段,本文通过MATLAB中的rand函数产生均匀分布的随机数,并通过排序打断顺序来实现对原始样本的随机抽样
20、。在模型建立阶段,本文运用神经网络的方法对真实国际航班数据进行分类学习,学习出该航线机票价格波动的规律,然后用学到的模型对测试数据进行检验,评估模型的好坏,并通过不断的修正模型的参数使模型达到全局最优,过程如图1-2所示。在所有的神经网络方法中,BP神经网络被人们广泛应用,所以本文运用单隐层的BP神经网络模型对航班历史数据进行训练学习,并对新数据进行预测分析。将预测结果与实际结果进行比较,根据比较来调整预测模型,最大化模型的预测准确率图12:模型建立过程图Figure 1-2 Model building process在对模型的预测结果进行分析阶段,本文主要是通过可视化分析技术对预测结果进行
21、作图展示,并利用表格对不同参数的模型的预测结果进行比较分析,使结果更加直观。14本章小结本章主要是对问题的研究做了简单的介绍。首先,本章阐述了问题研究的背景,生活水平的提高,大数据时代的到来,使旅游大数据成为热门话题。面对多一3一 U万方数据黑龙江大学硕士学位论文种多样的航班海量数据,如何对数据有效利用,并为我们带来收益是重中之重。其次,介绍了本文研究的主要内容,大数据理论,样本数据处理,神经网络票价预测模型。最后,本章介绍了问题研究的主要方法:常值填补缺失值,随机抽样,BP神经网络,可视化分析。4万方数据第2章大数据及数据挖掘理论第2章 大数据及数据挖掘理论21 大数据概念及相关技术互联网、
22、云计算等新兴信息技术的快速发展,促使了数据量急剧的增加,推动了大数据时代的到来。未来学大师阿尔文托夫勒曾在一本书中将大数据称为“第三次浪潮的华彩乐章”【1】。大数据就是互联网发展到一定阶段的必然产物,这使一些原本很难收集和使用的数据开始容易被利用起来。211 大数据的理论目前对于大数据的概念还没有明确的定义。维基百科上对大数据的定义是:数据量规模巨大到无法通过常用的软件进行获取、处理、整理成为有助于企事业进行决策的信息。全球知名的麦肯锡公司在报告研究中指出: “数据,已经进入到各个行业领域和人们生活的方方面面,而对于大规模数据的采集和使用,预示着新一波的生产率的增长”。国际数据中心(IDC)在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 国际航班 价格 预测 模型 研究 赵明莉
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内