应用马可夫决策过程进行课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《应用马可夫决策过程进行课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 马可 决策 过程 进行 课件
- 资源描述:
-
1、指導老師:吳文洪指導老師:吳文洪組員:許筱茹組員:許筱茹 葉玟妏葉玟妏詹秀櫻詹秀櫻 關若倩關若倩 唐寶如唐寶如研研 究究 動動 機機研研 究究 步步 驟驟 與與 方方 法法實實 證證 結結 果果 與與 分分 析析結結 論論 與與 建建 議議經濟環境是經常變化的,對於不同的經經濟環境是經常變化的,對於不同的經濟環境,可以認為事物處於不同的狀態濟環境,可以認為事物處於不同的狀態中,馬可夫決策過程(中,馬可夫決策過程(Markov DecisionMarkov Decision ProcessProcess)的理論,可以對事物不同狀態)的理論,可以對事物不同狀態的初始機率與狀態之間的移轉機率予以的初
2、始機率與狀態之間的移轉機率予以估算,以確定狀態變化趨勢,及預測事估算,以確定狀態變化趨勢,及預測事物的未來。物的未來。馬可夫決策過程馬可夫決策過程資資料料準準備備最佳策略求解最佳策略求解&實證結果分析實證結果分析結論與建議結論與建議馬可夫決策過程是由四組參數所構成的決策模式馬可夫決策過程是由四組參數所構成的決策模式 1.1.狀態變數(狀態變數(State variableState variable)2.2.移轉機率(移轉機率(Transition probabilityTransition probability)3.3.決策變數(決策變數(Decision variableDecision
3、 variable)4.4.期望利潤(期望利潤(Expected rewardExpected reward)本研究的實驗對象為民國九十五年證交本研究的實驗對象為民國九十五年證交所的個股股價資料。擷取由九十五年一所的個股股價資料。擷取由九十五年一月二日至九十五年六月三十日,此六個月二日至九十五年六月三十日,此六個月的資料當作原始資料,其中含塑膠類月的資料當作原始資料,其中含塑膠類、電子類、金融類、鋼鐵類、汽車工業、電子類、金融類、鋼鐵類、汽車工業類項目包括營業的每天日資料的開盤價類項目包括營業的每天日資料的開盤價、最高價、最低價與收盤價。、最高價、最低價與收盤價。表表1 1即為亞聚股價記錄表的
4、表格,其中即為亞聚股價記錄表的表格,其中,第一類資料為每檔股票的交易日期、收盤,第一類資料為每檔股票的交易日期、收盤價格和開盤價格。價格和開盤價格。第二類資料有九個欄位,而此九個欄位均依第二類資料有九個欄位,而此九個欄位均依據每日的第一類資料而來據每日的第一類資料而來(如圖如圖1 1)。第三類資料記錄收盤價落點區間,依據第第三類資料記錄收盤價落點區間,依據第二類資料分出區間後,由二類資料分出區間後,由H1H1至至H5H5,L5L5至至L1L1,共記取,共記取1010個股價狀態變數個股價狀態變數(如圖如圖2 2)。第一類第一類第三類第三類第一類第一類第三類第三類交易日交易日開盤價開盤價收盤價收盤
5、價收盤價記收盤價記號號交易日交易日開盤價開盤價收盤價收盤價收盤價記收盤價記號號95/1/213.813.5L595/4/612.512.75L395/1/313.713.85H595/4/712.7512.6L395/1/41413.85H595/4/1012.612.55L395/1/513.914.15H595/4/1112.5512.85L495/1/614.314.6H495/4/1212.812.95L495/3/2912.2512.25L295/6/2612.312.6L3 H1 H2 H3 H4 H5 L5 L4 L3 L2 L1第二類第二類0+20+20+1.50+1.50+1
6、0+10+0.50+0.50 00-0.50-0.50-10-10-1.50-1.50-20-215.815.815.315.314.814.814.314.313.813.813.313.312.812.812.312.311.811.8I+2I+1.5I+1I+0.5II-0.5I-1I-1.5I-2I+2I+1.5I+1I+0.5II-0.5I-1I-1.5I-2H1 H2H3H4H5L5L4L3L2L1本研究是利用每家公司過去的歷史股價資料本研究是利用每家公司過去的歷史股價資料,來計算每個狀態變數的移轉機率,因此每,來計算每個狀態變數的移轉機率,因此每家公司各有不同的移轉機率。家公司各
7、有不同的移轉機率。舉例而言,以亞聚為例:自舉例而言,以亞聚為例:自9595年年1 1月月2 2日至日至9595年年6 6月月2929日收盤價記號,經統計後可得到每日收盤價記號,經統計後可得到每個狀態變數由前一個交易日轉變為次一個交個狀態變數由前一個交易日轉變為次一個交易日的狀態變化總次數,如易日的狀態變化總次數,如表表2 2及及表表3 3所示。所示。2006/1/22006/6/30H1H2H3H4H5L5L4L3L2L1totalH1H2H322H42226H5217423L538718L41519328L31229335L2358L12006/1/22006/6/30EXAMPLES:19
8、49H1 H2H3H4H5L5L4L3L2L1totalH10H20H312H40.333 0.333 0.3336H50.087 0.739 0.17323L50.167 0.444 0.38918L40.036 0.178 0.679 0.08628L30.029 0.057 0.829 0.08635L20.375 0.6258L10在本研究的數學模式中,所謂的決策變數即為在本研究的數學模式中,所謂的決策變數即為股票投資時的操作方法,本研究採用買進賣出、股票投資時的操作方法,本研究採用買進賣出、融券、補券與持有操作策略。其中,融券、補券與持有操作策略。其中,買進策略買進策略:1.1.買進
9、買進:每次只買進或補券一張股票。每次只買進或補券一張股票。2.2.若於買進狀態時,而連續幾天均出現適於買進股票的若於買進狀態時,而連續幾天均出現適於買進股票的狀態時,則視為該股續抱。狀態時,則視為該股續抱。賣出策略賣出策略:1.1.賣出賣出:每次只賣出或融券一張股票。每次只賣出或融券一張股票。2.2.若於賣出狀態時,而連續幾天均出現適於賣出股票的若於賣出狀態時,而連續幾天均出現適於賣出股票的狀態時,則視為該股續抱。狀態時,則視為該股續抱。期望利率的計算方法:期望利率的計算方法:1.1.令今日收盤價為令今日收盤價為。2.2.由於台灣股市交易法規定,每日股票漲跌幅由於台灣股市交易法規定,每日股票漲
10、跌幅為昨日收盤價的為昨日收盤價的7%7%,因此將,因此將P P可切分為可切分為1414個區個區間,各區間以間,各區間以k1k1,k2k2、.如如表表4 4來表示。來表示。3.3.利用過去實際的收盤價歷史資料,來統計次利用過去實際的收盤價歷史資料,來統計次一日收盤價格會落入前一日一日收盤價格會落入前一日1414個股價等分區個股價等分區間的機率值。因此可以分別計算得出如間的機率值。因此可以分別計算得出如表表5 5的的條件機率表。條件機率表。4.4.根據表根據表5 5的條件機率值,即可計算出當策略為的條件機率值,即可計算出當策略為買進時,在各個不同狀態下的期望利潤值如買進時,在各個不同狀態下的期望利
11、潤值如表表6 6。tdP P(Pj=k1|Pi=Ptd,Si=H1)P(Pj=k2|Pi=Ptd,Si=H1)P(Pj=k3|Pi=Ptd,Si=H1).P(Pj=k14|Pi=Ptd,Si=H1)P(Pj=k1|Pi=Ptd,Si=H2)P(Pj=k2|Pi=Ptd,Si=H2)P(Pj=k3|Pi=Ptd,Si=H2).P(Pj=k14|Pi=Ptd,Si=H2)P(Pj=k1|Pi=Ptd,Si=L1)P(Pj=k2|Pi=Ptd,Si=L1)P(Pj=k3|Pi=Ptd,Si=L1).P(Pj=k14|Pi=Ptd,Si=L1)(Pi(Pi:前一日收盤價:前一日收盤價 PjPj :次一
展开阅读全文