Python Numpy・Scikit-learnを使った単回帰分析について【3ステップ解説 回帰の基礎からPythonでの分析まで】
エンジニア+データサイエンティスト/2=kgrneerと申します(*'ω'*)
機械学習エンジニアならば,誰もが通るであろう『回帰分析』意外と内容がまとまっている記事が少ないように感じたので,
『そもそも回帰分析とは何か』という方のために回帰分析の基礎から学び,実際にPythonを使って近似曲線描画⇒分析という流れで分析するまでを一つにまとめてみました。実際に分析を行っており,コードも公開しております。
全編,具体例としてCreepyNutsのCD価格を分析してます!!ただのファンです。すいません。
Step1:回帰分析のイメージを掴む。
回帰分析には線形とか非線形とか、単回帰とか重回帰とか解りづらい言葉が多く,機械学習初心者あるいはPython初学者の中にはこういった言葉を見るだけで嫌になる人も多いのではないでしょうか。(文系高卒の私も例外ではありませんでした。)
そういった方のために回帰分析とは何かどんな分類がされているのか。ということから簡単なグラフ描画までをまとめてあります。
Pythonの使い方さえわかりゃいい!!という方は飛ばしてください(*'ω'*)
Step2.線形単回帰分析 PythonのScikit-learnを使って分析してみる
回帰分析の中で最も単純なのは線形単回帰分析です。Pythonのscikit-learnを使って分析してみます!!単純な分析であれば,線形単回帰で十分です。
近似曲線の描画から,実際に算出を行う過程までを詳細に記載してあります!!
厳しめの助手『ミルクちゃん』に怒られながら頑張る姿も必見です。
Step3.非線形単回帰分析 NumpyとScikit-learnを使って分析
ちょっと難易度UP。ここまで来ればPythonでの単回帰分析は対外のことに対応できるでしょう。
非線形単回帰では次数の考え方が重要であると共に、『決定係数』というパラメータがもの凄く重要になります。
分析後のデータをどう扱うのかといことまで書いたまとめ編です!!
Step3までを網羅すると,Pythonでの単回帰分析はほぼ完ぺきにできます!!
是非よんでみて下さい!!
明日は明日の風が吹く kgrneerでした♪
この記事を投稿は下記のブログから引用しております。