投資者情緒對股票市場回報(bào)率的影響探討
本文是一篇投資分析論文,通過挖掘分析微博平臺中投資者情緒的變化發(fā)現(xiàn),在疫情這個(gè)大環(huán)境背景下,網(wǎng)絡(luò)社交媒體中的網(wǎng)絡(luò)輿情會對股市產(chǎn)生影響,因此從網(wǎng)絡(luò)輿情的角度對投資者、網(wǎng)絡(luò)社交平臺提出相關(guān)建議。
1相關(guān)理論與方法基礎(chǔ)
1.1行為金融學(xué)理論
傳統(tǒng)金融學(xué)理論認(rèn)為,金融市場上的投資者均為理性人,金融市場是一個(gè)有效的市場。由于投資者是理性的,金融市場資產(chǎn)價(jià)格并不會隨著投資者情緒產(chǎn)生波動(dòng)。但隨著時(shí)間推移,金融市場上出現(xiàn)許多有效市場假說無法解釋的異象。傳統(tǒng)金融學(xué)理論認(rèn)為的觀點(diǎn)與如今的實(shí)際數(shù)據(jù)出現(xiàn)偏差?;谶@些偏差,學(xué)者們開始質(zhì)疑傳統(tǒng)金融學(xué)理論的適用性,行為金融學(xué)理論逐漸產(chǎn)生。
行為金融學(xué)理論將人類心理活動(dòng)如何對金融市場產(chǎn)生影響納入研究范圍[41]。隨著行為金融學(xué)理論的迅速發(fā)展,對傳統(tǒng)金融學(xué)理論造成了很大的沖擊。行為金融學(xué)博采眾長,涉及心理學(xué),社會學(xué)等領(lǐng)域、人類學(xué)及其他有關(guān)概念,從行為產(chǎn)生的內(nèi)在心理活動(dòng)進(jìn)化開始,探討了投資者投資決策在金融市場中的作用。行為金融學(xué)理論具有許多代表性學(xué)說,例如認(rèn)知偏差理論。認(rèn)知偏差理論指出,當(dāng)一個(gè)人面對投資決策時(shí),根據(jù)自己的經(jīng)驗(yàn)法則來評判,這一行為易導(dǎo)致決策失誤。行為金融學(xué)包括許多經(jīng)典理論,這些理論為后續(xù)投資者情緒對金融市場影響的相關(guān)研究奠定了扎實(shí)的理論基礎(chǔ)。
..................
1.2文本挖掘技術(shù)
在網(wǎng)絡(luò)信息時(shí)代,用戶可通過網(wǎng)絡(luò)獲取各種不同形式,不同門類的數(shù)據(jù),包括技術(shù)資料,娛樂資訊。組成一個(gè)異常巨大的數(shù)據(jù)庫。對大量數(shù)據(jù)進(jìn)行采集和加工,傳統(tǒng)信息檢索技術(shù)的加工方法已不能令人滿意,而文本挖掘技術(shù)可以有效解決這一問題[42]。文本挖掘作為數(shù)據(jù)挖掘中的重要分支之一,它是從數(shù)據(jù)挖掘演變而來。它可以將網(wǎng)絡(luò)中獲取的文本內(nèi)容轉(zhuǎn)化為可被利用的信息,但它不僅僅是將數(shù)據(jù)挖掘技術(shù)簡單地挪用到文本上,還需要做很多準(zhǔn)備與處理工作。
1.2.1文本挖掘過程介紹
文本挖掘是一個(gè)從非結(jié)構(gòu)化到結(jié)構(gòu)化的過程,是多方技術(shù)的綜合。總體來看,文本挖掘是將非結(jié)構(gòu)化的原始文本信息進(jìn)行一系列處理,變成結(jié)構(gòu)化數(shù)據(jù)從而進(jìn)行知識發(fā)現(xiàn)。根據(jù)文本挖掘工作的流程,將其過程分為以下幾個(gè)部分:
(1)文本獲?。壕W(wǎng)絡(luò)文本一般以網(wǎng)頁的形式出現(xiàn),需要利用爬蟲技術(shù)對網(wǎng)頁進(jìn)行抓取并形成文本數(shù)據(jù)庫。
(2)文本預(yù)處理;對文本信息進(jìn)行篩選,去除網(wǎng)頁中的不必要信息。
(3)分詞:詞是最小的情感單元,分詞即將連續(xù)的句子按照規(guī)則切分成詞語,對于中文分詞,國內(nèi)已有許多開源的分詞工具。
(4)去停用詞:將一些如標(biāo)點(diǎn)符號等沒有研究意義的停用詞去除,有利于更高效地處理數(shù)據(jù)。
(5)特征選擇:從原始特征中篩選出有效特征從而對數(shù)據(jù)集進(jìn)行降維的過程。
(6)文本挖掘:完成上述步驟后,文本數(shù)據(jù)轉(zhuǎn)化為矩陣,根據(jù)需要選擇算法對文本進(jìn)行挖掘。
....................
2投資者情緒指數(shù)的構(gòu)建
2.1文本信息獲取來源及采集方法
2.1.1文本信息獲取來源
互聯(lián)網(wǎng)如今作為重要的信息獲取來源,迎來了大量的使用者。根據(jù)CNNIC發(fā)布的第49次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2021年12月,互聯(lián)網(wǎng)使用者的數(shù)目已經(jīng)達(dá)到10.32億,互聯(lián)網(wǎng)普及率達(dá)到73.0%[43]。隨著網(wǎng)民規(guī)模的穩(wěn)步增長,更多的人會主動(dòng)地在社交媒體平臺發(fā)表自己的意見看法,表達(dá)自己對各類事件的情緒,互聯(lián)網(wǎng)成為情緒信息獲取的重要平臺。本文也選擇互聯(lián)網(wǎng)中社交媒體作為構(gòu)造投資者情緒所需的文本數(shù)據(jù)來源,對比各種社交媒體,本文最終選擇微博作為信息獲取來源。微博在社會分發(fā)速度、影響力、傳播速度等方面都優(yōu)于其他社交媒體。也是現(xiàn)在年輕人進(jìn)行資源共享及信息交流的首選工具。由于本文研究發(fā)生于新冠疫情背景下,對于新冠疫情這種影響廣泛的突發(fā)公共衛(wèi)生事件,人們更愿意在微博這種面向大眾的平臺上表達(dá)自己的觀點(diǎn)與看法,因此微博更能及時(shí)地反映情緒的變化。綜上,本文選擇微博作為文本信息的獲取來源。
2.1.2文本信息的爬取方法
由于微博數(shù)據(jù)復(fù)雜且存在各種限制,無法通過普適性方法對所需全部信息進(jìn)行抓取,因此,本文采用爬蟲技術(shù),根據(jù)本文所需數(shù)據(jù)自行編寫程序,來實(shí)現(xiàn)文本自動(dòng)化抓取。爬蟲是指模擬瀏覽器通過一些程序?qū)W(wǎng)絡(luò)信息自動(dòng)抓取的過程。爬蟲的基本流程如圖2-1:
投資分析論文參考
...............................
2.2文本數(shù)據(jù)的預(yù)處理
經(jīng)過爬蟲技術(shù)獲取微博原始文本后,需要經(jīng)過清洗、分詞、去除停用詞等預(yù)處理工作,才能轉(zhuǎn)化成可以被識別的格式,進(jìn)而開展后續(xù)的分類和情感分析工作。文本數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗。分詞及去除停用詞。
2.2.1文本數(shù)據(jù)清洗
爬取的微博數(shù)據(jù)常常都帶有一些無關(guān)字符和網(wǎng)頁鏈接的標(biāo)簽等,還有一些語句中夾雜的符號,如“【】”“#”等,這些對文本的情緒分析無關(guān),可能會影響情緒分析的準(zhǔn)確性。因此,在進(jìn)行文本分析前,要對這些無關(guān)信息進(jìn)行數(shù)據(jù)清洗。
2.2.2文本分詞
由于中文語句一般沒有空格符間隔,因此需要將語句進(jìn)行切分割,將每條語句的詞語分開,轉(zhuǎn)化為一個(gè)個(gè)有語義特征的詞語,進(jìn)而轉(zhuǎn)化為一定長度的數(shù)值型特征向量進(jìn)行后續(xù)的情緒分析及相關(guān)計(jì)算。分詞是分類過程的一個(gè)基本環(huán)節(jié),文中選用的分詞方法是在Python環(huán)境中使用jieba分詞程序包實(shí)現(xiàn)中文文本數(shù)據(jù)分詞。把它加工為具有語義特征的一定長度的詞。
jieba是一款被廣泛使用的高性能及高準(zhǔn)確率的中文開源分詞包。且提供如Python、C++等多種編程語言支持,使用非常方便。它是基于規(guī)則和統(tǒng)計(jì)兩種方法建立的。jieba分詞支持四種分詞模式,即精確模式、全模式、搜索引擎模式和Paddle模式,本文主要調(diào)用了分詞模式中的精確模式,這個(gè)模式能最準(zhǔn)確地分離句子,適合文本分析。同時(shí),jieba分詞支持用戶添加自定義詞典,以便包含jieba里沒有的詞匯。在分詞過程中發(fā)現(xiàn),jieba分詞庫的詞匯不完全包含疫情相關(guān)固定詞匯,會容易導(dǎo)致這些詞匯被錯(cuò)誤地拆分,通過對分詞后的結(jié)果進(jìn)行歸納整理,形成了疫情自定義詞典,將其加入到j(luò)ieba自定義分詞庫中重新進(jìn)行分詞。例如,沒有添加自定義詞典前,jieba原始分詞庫將“無癥狀感染者”分成“無癥狀”和“感染者”兩個(gè)詞語,所以為了保證分詞的嚴(yán)謹(jǐn)性,將這些疫情固定詞匯加入再進(jìn)行分詞,以達(dá)到更為精準(zhǔn)的效果。
......................
3投資者情緒對股票市場回報(bào)率影響的實(shí)證分析......................23
3.1樣本選取................................23
3.2變量說明....................................23
4投資者情緒對股票回報(bào)率影響的行業(yè)差異分析....................33
4.1樣本選取......................................33
4.1.1醫(yī)藥行業(yè)樣本選取................................33
4.1.2旅游行業(yè)樣本選取............................33
5研究結(jié)論與政策建議...............................47
5.1研究結(jié)論........................................47
5.2相關(guān)政策建議............................48
4投資者情緒對股票回報(bào)率影響的行業(yè)差異分析
4.1樣本選取
4.1.1醫(yī)藥行業(yè)樣本選取
在新冠疫情的強(qiáng)烈沖擊下,國內(nèi)大部分行業(yè)都停滯不前。相對于其他行業(yè)而言,醫(yī)藥行業(yè)自身的韌性很強(qiáng),遇到疫情沖擊時(shí)自我調(diào)節(jié)能力較強(qiáng)。從股價(jià)的角度來看,疫情期間醫(yī)藥衛(wèi)生行業(yè)發(fā)展迅猛,醫(yī)藥行業(yè)股票價(jià)格呈上漲趨勢,市場對于醫(yī)藥行業(yè)股票回報(bào)率的確定性,使醫(yī)藥股備受投資者的青睞。
本文選擇上證醫(yī)藥主題指數(shù)(000121)作為衡量醫(yī)藥行業(yè)的代表指數(shù)。上證醫(yī)藥主題指數(shù)是從上證綜指中以規(guī)模大小為標(biāo)準(zhǔn),選擇歸屬于醫(yī)藥衛(wèi)生行業(yè)的50只主題股票組成的指數(shù),是上交證券所上市的大、中市值且日成交金額為前50支的股票組合。這一指數(shù)具有較高的相關(guān)性和準(zhǔn)確性,能較好地反映醫(yī)藥股的整體市場波動(dòng),因此該指數(shù)被選為反映醫(yī)藥股整體表現(xiàn)的代表性指數(shù)。
4.1.2旅游行業(yè)樣本選取
以人員的空間移動(dòng)為主的旅游業(yè),對于疫情這類重大突發(fā)公共事件具有高敏感性。由于旅游活動(dòng)本身具有時(shí)空特點(diǎn),因此旅游業(yè)的恢復(fù)要比其他行業(yè)慢很多,損失和影響也是即刻顯現(xiàn)的。與此同時(shí),因?yàn)橐咔楸l(fā)是在春節(jié)來臨之際,許多居民的出游計(jì)劃被迫取消,大多旅游企業(yè)經(jīng)營舉步維艱,投資者對于疫情的悲觀情緒使得收益率下降。本文選擇中證旅游指數(shù)(930633)作為旅游行業(yè)的代表指數(shù)。
投資分析論文怎么寫
.......................
5研究結(jié)論與政策建議
5.1研究結(jié)論
在新冠疫情背景下,股票市場發(fā)生嚴(yán)重震蕩,通過研究新冠疫情引起的投資者恐慌情緒對股票市場的影響,有助于投資者做出合理投資決策。本文選取2020年1月9日到2021年12月31日作為研究區(qū)間,選擇微博作為反映投資者對疫情產(chǎn)生情緒變化的文本信息來源,利用網(wǎng)絡(luò)爬蟲技術(shù)完成了新冠疫情相關(guān)微博內(nèi)容的收集工作,并對收集到的文本進(jìn)行分詞等預(yù)處理工作后,利用隨機(jī)森林算法對全部文本進(jìn)行分類,分別構(gòu)建了疫情爆發(fā)期和疫情常態(tài)期的投資者情緒指數(shù),并構(gòu)建VAR模型與對應(yīng)時(shí)間段的A股市場回報(bào)率進(jìn)行實(shí)證研究,分析疫情不同時(shí)期投資者情緒與A股市場回報(bào)率二者的關(guān)系,同時(shí)選取受疫情影響較大的3個(gè)行業(yè),分別是醫(yī)藥、旅游、交通運(yùn)輸。利用VAR模型,研究疫情不同時(shí)期投資者情緒對不同行業(yè)的影響差異。本文主要得出以下結(jié)論:
一、投資者情緒與A股市場回報(bào)率存在單向格蘭杰因果關(guān)系,且該種關(guān)系僅在疫情爆發(fā)期存在。在疫情爆發(fā)期,投資者情緒是股票市場回報(bào)率的格蘭杰原因、因?yàn)樵谝咔槌醣l(fā)的時(shí)期,投資者面對突發(fā)疫情無法快速做出決策,較為依賴社交平臺上其他投資者態(tài)度影響,當(dāng)發(fā)布內(nèi)容多為對疫情及市場利害信息后,投資者投資的意愿減少,導(dǎo)致回報(bào)率降低;但在疫情常態(tài)期,投資者情緒不是市場回報(bào)率格蘭杰原因,因?yàn)樵诖藭r(shí)期,投資者面對常態(tài)化疫情已經(jīng)可以自主分析市場變化趨勢,對社交平臺發(fā)表言論及態(tài)度的參考性減少。
二、投資者情緒變化會引起A股市場回報(bào)率的變化,但在疫情不同時(shí)期的股票回報(bào)率對投資者情緒的反應(yīng)程度有所不同。從脈沖響應(yīng)和方差分解結(jié)果來看,在疫情爆發(fā)期,投資者情緒的變動(dòng)會導(dǎo)致A股市場回報(bào)率產(chǎn)生同向變動(dòng),投資者情緒增加會導(dǎo)致A股市場回報(bào)率增加,影響可持續(xù)7-8期,解釋力度可達(dá)到24.45%左右,疫情爆發(fā)期投資者情緒對股票市場回報(bào)率影響不容忽視。在疫情常態(tài)期,投資者情緒的變化對A股市場回報(bào)率的影響作用十分微弱,解釋力度僅為0.65%,隨著疫情發(fā)展進(jìn)入中長期,市場恐慌情緒逐漸穩(wěn)定,疫情進(jìn)入常態(tài)化,帶給股市的邊際效益減弱,說明疫情對A股市場產(chǎn)生的邊際震蕩效應(yīng)逐漸減弱。
參考文獻(xiàn)(略)
- 農(nóng)業(yè)綜合開發(fā)項(xiàng)目投資分析——以當(dāng)涂縣江心洲國際...2023-10-30
- 企業(yè)數(shù)字化能提高對外直接投資速度嗎?2024-01-02
- 公司創(chuàng)業(yè)投資對被投資企業(yè)技術(shù)創(chuàng)新績效的作用機(jī)制...2024-02-08
- 累積前景理論下投資組合問題的分析和求解2024-03-11