RSSおすすめ記事です

スポンサーリンク

データサイエンス向け言語はRとPythonのどっち?

ニュースAI, プログラム

スポンサーリンク

データサイエンス向け言語はRとPythonのどっち?

1 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:01:56.83 ID:CAP_USER.net

このほど、「matloff/R-vs.-Python-for-Data-Science|GitHub」に、データサイエンスで利用するという観点からプログラミング言語であるRとPythonを比較した記事が掲載された。これまで、データサイエンスの分野ではRが使われることが多かったが、近年はPythonの利用が進んでいる。

記事の執筆者であるNorm Matloff氏はカリフォルニア大学デービス校におけるコンピュータサイエンスの教授。以前は、同大学で統計学の教授だったようだ。同氏はR関連の書籍を4冊執筆しているほか、現在はR Journalの編集長を務めている。同氏はこれまでの経験および統計学者/コンピュータ学者という視点から、今回のトピックに関して有用な光を当てることができるだろうと説明している。

執筆段階で掲載されている比較の主な内容は次のとおり。

項目 内容
優雅さ 明らかにPythonの勝ち。主観的ではあるもの、これまでさまざまなプログラミング言語を使ってきた経験や教育してきた経験から、Pythonにおける括弧や中括弧の利用が大幅に減少したことにとても感謝している

学習曲線 Rの大勝利。Pythonを使ってデータサイエンスを始めるにはNumPy、Pandas、matplotlibなど、Python以外のライブラリについて学ぶ必要がある。また、パッケージ構成も時に難しい。Pythonに比べると、Rには行列型と基本的なグラフが最初から組み込まれており、数分以内に簡単なデータ解析を行うことができる

データサイエンス向けライブラリ Rがちょっとだけ優勢。CRANに登録されているパッケージは1万4000個ほど、PyPIに登録されているパッケージは18万3000個ほどとPytPIのほうが多い。しかし、データサイエンスに関するものはそれほど多くない

機械学習 Pythonがちょっとだけ優勢。多くの人にとって機械学習はNNを意味しており、NN用ソフトウェアの多くはPythonに関連している

統計的な正確さ Rの大勝利。Rは統計学者によって統計学者のために開発されている

並列計算 引き分け。RもPythonもベースバージョンはマルチコア計算に対して優れたサポートを提供しているとは言い難い

C/C++インタフェース Rがちょっとだけ優勢。どちらにもC/C++インタフェースは存在しているが、PythonのそれはRと比べるとそれほど強力なものではない

オブジェクト指向/メタプログラミング Rがちょっとだけ優勢。どちらもオブジェクト指向をサポートしているが、RのほうがPythonよりも真剣度が高い

言語の統一性 Rはとてもひどい状況。Rは複数の実装系が存在しており、使っていない実装系のコードは読むことが難しい状況になっている

リンクデータ構造 Pythonの勝ち。Pythonでは簡単に実装することができる

オンラインヘルプ Rの大勝利。Rのhelp()関数はPythonよりも情報が多い
以下ソース
https://news.mynavi.jp/article/20190619-845288/


スポンサーリンク

ネットの反応

3 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:08:14.88 ID:BakQS1zZ.net
Left Caption

データ分析クラスタも機械学習クラスタも
仕事や勉強で忙しくて
こんなクソみたいなところに書き込んだりせんだろ。

4 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:08:14.94 ID:9YVJ9qiw.net
Left Caption

うーん、用途と使う層が違うから
比べてもしょうがないよな
ただ、統計の勉強にはRがいいと思うし、それからpython
使ってもいいだろうし、まあ両方使えば良いんじゃない。
R は、すぐにやってみられるし、検算用でも良いしね

5 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:10:23.11 ID:9YVJ9qiw.net
Left Caption

Rは、プログラミング言語ではあるけど
数学処理系といった感じですぐ使えるから、両方で良いんじゃないかい

6 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:13:17.57 ID:nN+3LQrd.net
Left Caption

Pythonはアホでも使えるという理由だけで
機械学習まわりで広く使われてるというだけだからな

自前で実装するなら言語は何でもいい

7 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:13:29.43 ID:9YVJ9qiw.net
Left Caption

しつこいけど、maximaも覚えとくと便利かもよ
微分とか記号のまま出来るし
こういうのは、同じ言語でも、数学知ってれば
そこそこ使えるからね。あ、別にpython目の敵に
してるわけではないよ。両方使えれば、もっと
便利だ、って言いたいだけだよ

8 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:13:47.22 ID:BuCQ0Poa.net
Left Caption

これからはPython主流になるんじゃないの
Perlが食われたように、Rも消えていきそう

11 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:32:54.68 ID:XDit8KU9.net
Left Caption

どっちもかじっておけばいいだろう

12 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:44:49.01 ID:zeaC2kj3.net
Left Caption

JAVAとC言語みたいに住み分けるだろ

13 : 名無しのシステムエンジニアさん 2019/06/21(金) 12:54:28.82 ID:nff+SbpO.net
Left Caption

Rしか使えないっす
というか、統計に関してはネット上の情報量がRの方が多いし…

16 : 名無しのシステムエンジニアさん 2019/06/21(金) 14:25:12.35 ID:ok3A4L/d.net
Left Caption

あんまり用途はかぶらない気がするが、ありうるとすればPythonがRの用途を取り込んでしまう方向

17 : 名無しのシステムエンジニアさん 2019/06/21(金) 14:47:54.44 ID:Jk7mMINv.net
Left Caption

それ以前にデータサイエンスってのがwww

19 : 名無しのシステムエンジニアさん 2019/06/21(金) 16:55:56.82 ID:ZWXr3onA.net
Left Caption

>>17
昔からやっていることでも、それらしい名前を付けると人が集まってくるんだよなぁ・・・

24 : 名無しのシステムエンジニアさん 2019/06/21(金) 22:57:54.57 ID:XiUewTyv.net
Left Caption

C++は万能の神、異論は認めない

25 : 名無しのシステムエンジニアさん 2019/06/22(土) 00:49:32.50 ID:5DQJmYDI.net
Left Caption

 
Rは分析ツール
pythonはデータシステム記述

という認識なんだが

28 : 名無しのシステムエンジニアさん 2019/06/22(土) 03:00:20.68 ID:jOao2o59.net
Left Caption

Rもpythonもc++も使ってるけど
pythonは正直要らない

30 : 名無しのシステムエンジニアさん 2019/06/22(土) 03:08:00.31 ID:zYE8Fgkb.net
Left Caption

Rは言語仕様的に微妙なところが多い。
例外処理とかNAとかほんと糞。

32 : 名無しのシステムエンジニアさん 2019/06/22(土) 08:22:00.80 ID:PshVvh2e.net
Left Caption

言語は手段
要は伝われば良い

35 : 名無しのシステムエンジニアさん 2019/06/22(土) 10:59:42.77 ID:mETSYX/M.net
Left Caption

Excelはビックデータ開けんでないか。
DB+シェルスクリプト で大半はできるけど、R使うのって、何計算させるんだ?

36 : 名無しのシステムエンジニアさん 2019/06/22(土) 11:10:37.08 ID:Jzxl5pfD.net
Left Caption

>>34-35
開けるが遅すぎる

37 : 名無しのシステムエンジニアさん 2019/06/22(土) 11:42:51.28 ID:XYdhKkxT.net
Left Caption

MathematicaとC++でおk

34 : 名無しのシステムエンジニアさん 2019/06/22(土) 10:38:00.57 ID:6iNqGOOx.net
Left Caption

ベテランは
 エクセルマクロで頑張れ

Posted by flac