進行的分析有以 ggplot2 繪製各市場、各品種的價格、交易量與時間變化關係。dplyr 篩選交易量大的市場與品種,plot 繪製價格與交易量關係,簡單 lm 回歸分析。以 filter 或 subset 篩選香蕉高價時與低價時的資料,觀察時間點與交易量。
我只要中間的表格部分,頂端的註解與後端的小計都刪掉。
讓資料的 row 是觀測點,colum 是變化項。複製資料貼到新的工作頁上,發現多出了一列數字,仔細觀察這個數字,可以看出是平均價格與交易量相乘的乘積。
將乘積取名為"市值",刪除兩列"增減"的項目。全選資料右鍵,點選儲存格格式,將格式轉為"通用格式",否則資料匯入 R 時數字會因格式的關係而有改變。
整理好的資料如下。
接著便可匯入 R 中進行分析了。我使用 markdown 撰寫並發表至 RPubs 上面:
Banana Price in Taiwan
excel 的前處理
先去下載感興趣的資料。
香蕉今年價格變化大,來看看香蕉的資料。下載後的資料長這個樣子。
我只要中間的表格部分,頂端的註解與後端的小計都刪掉。
讓資料的 row 是觀測點,colum 是變化項。複製資料貼到新的工作頁上,發現多出了一列數字,仔細觀察這個數字,可以看出是平均價格與交易量相乘的乘積。
Banana Price in Taiwan
下一篇使用 markdown 在網頁上呈現 R --- 觀察香蕉價格會公開文件內容。
沒有留言:
張貼留言