RSSおすすめ記事です

スポンサーリンク

【IT】データサイエンティスト職に求められる言語のトップに「Python」–「R」を上回る

ニュースプログラム

プログラム

スポンサーリンク

1: 名無しのシステムエンジニアさん 2019/01/12(土) 18:37:50.17 ID:CAP_USER

「Python」と「R」はデータサイエンティスト職の求人で

最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。

まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm

2: 名無しのシステムエンジニアさん 2019/01/12(土) 18:38:58.81 ID:UT9z2lcu
データサイエンティストに求められるのは言語ではない
数字を読む能力なのに

 

14: 名無しのシステムエンジニアさん 2019/01/12(土) 19:32:26.78 ID:kDQzC5W5
>>2
数字を読むのはAIの役目

 

69: 名無しのシステムエンジニアさん 2019/01/13(日) 04:03:21.73 ID:w+vTZU2B
>>14
なんか、いろいろとバカが滲み出ている発言だなw

 

78: 名無しのシステムエンジニアさん 2019/01/13(日) 09:23:52.78 ID:4qHb4AL0

>>69
おまえが無知なだけですよ

数字を読んで傾向を割り出すのがAIの仕事

傾向からパタン認識して未来予測するのがデータサイエンス

 

87: 名無しのシステムエンジニアさん 2019/01/13(日) 13:10:05.47 ID:pSQYDZ7L

>>78
逆だろ

数字を読んで傾向を割り出すのはデータマイニングで、AIじゃない

また、データマイニングも、数字をそのまま入力して良い結果が得られるケースは殆ど無く、人間が数字を読んで前加工して、適切なマイニングツールを選ばなきゃならない
それがデータサイエンティスト

データサイエンティストが組んだ前処理とマイニングツールの組み合わせを使って、新たなデータから傾向を見出して、何かのアクションを自動化するのがAI

 

4: 名無しのシステムエンジニアさん 2019/01/12(土) 18:55:36.17 ID:K7woRKwy
Rは統計データを扱うのに特化した言語であって
システムを組むには不向きなだけだろ

 

6: 名無しのシステムエンジニアさん 2019/01/12(土) 18:57:58.43 ID:dibLf/yi

Python 遅いけど、、

使いやすいし、便利なライブラリも多い。

 

104: 名無しのシステムエンジニアさん 2019/01/13(日) 18:21:48.70 ID:ldWl6bNC
>>6
スピードかかる所は
Cのプラグイン化でええだろ

 

7: 名無しのシステムエンジニアさん 2019/01/12(土) 19:05:32.54 ID:XHrLj9Fn
基本をC、ライブラリは都合のいいもの。今はたしかにPython。
Rは統計というかデータベース用だとおもう。

 

8: 名無しのシステムエンジニアさん 2019/01/12(土) 19:09:51.27 ID:hEuBy7aA
Rubyは流行ることなく終わったな

 

10: 名無しのシステムエンジニアさん 2019/01/12(土) 19:15:41.63 ID:ephSBmTY
最近は機械学習系のライブラリがみんなPythonだからな
イヤでも使うしかない

 

11: sage 2019/01/12(土) 19:24:51.91 ID:OWQfCzk/
>>10
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない!

 

16: 名無しのシステムエンジニアさん 2019/01/12(土) 19:41:12.41 ID:ephSBmTY

>>11
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう

ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる

最後は何を作りたいかで決まるでしょう

 

45: 名無しのシステムエンジニアさん 2019/01/12(土) 23:59:40.74 ID:HhxoKhz8

>>11
何パーセントとか関係ないでしょ。
CにしろJavaにしろPythonにしろ言語作ったのは数人~数十人とか。
それを何百万人ものプログラマが使ってる。

人数の多寡ではなく影響力。
影響力ある人が数人でも始めればそれが波及する。

アメリカで機械学習をやってる人たちってのは影響を与える側。
その人たちがPythonを使い出せば、新しいアルゴリズムの
ライブラリや機械学習の教科書のコードがPythonで書かれるようになる。
やがて他国の研究者もそのライブラリを使うためにPythonに乗り換える。

日本のITエンジニアが何言語使おうと世界に影響は殆どないけどね。

 

22: 名無しのシステムエンジニアさん 2019/01/12(土) 20:11:46.83 ID:PAeBiU62
でもモジュール作る人はc/c++じゃないの?
データサイエンティストと言う人らはフロントだけを作るの?

 

30: 名無しのシステムエンジニアさん 2019/01/12(土) 20:39:23.01 ID:FyOIkd6T

>>22
機械学習とかはサーバサイドだろ。
サーバでPythonが動き、C/C++で書かれてコンパイルされたライブラリーを呼び出す。
サーバサイドのフレームワークはPHP/Ruby/Pythonあたり。
フロントエンドではJavascript/HTML/CSSが動き、
C#とかJava書かれたソフトも動いてるかもしれん。

今時1つの言語じゃ大したことできねーぞ。

 

35: 名無しのシステムエンジニアさん 2019/01/12(土) 21:04:11.03 ID:7pg+voxm
>>30
全体でみればそうかもしれないが。
データサイエンティストとして要求されるのはPythonにほぼ限定されるかと。
機械学習とかAIはPythonでやって結果は別人、グループへ。

 

24: 名無しのシステムエンジニアさん 2019/01/12(土) 20:16:59.67 ID:sJf3fT7h
Rはデータ処理しやすいから好き
書き方も好き

 

25: 名無しのシステムエンジニアさん 2019/01/12(土) 20:17:56.46 ID:7pg+voxm
これはおかしい
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった

 

85: 名無しのシステムエンジニアさん 2019/01/13(日) 12:57:35.18 ID:pSQYDZ7L

>>25
言語としても優れてるよ

実装したいアルゴリズムをコンパクトに記述できる
型定義や型変換など、アルゴリズムとは関係ない余計な記述が殆どいらない
インデントで構造が明確で、閉じカッコの様な余計な行が不要

pythonだと、人間はアルゴリズムに集中できる
他の言語ではコンパイラやインタープリターを支援する為に、どれだけ余計な記述を強いられているかがわかる
コードが読みやすいので、仕様書は要らず、数カ月前に書いたコードでも動作を思い出せ、改造が楽

職業プログラマーではない、サイエンティストにとって、最適な言語だ

 

86: 名無しのシステムエンジニアさん 2019/01/13(日) 13:07:38.53 ID:4VcpaMum
>>85
そうかー,今MATLABで計算しているので,できるだけFORループを使わないように行列演算だけでなんとかならないかと苦戦してるんだけど,それもなくなるのか。
まあ,MATLABは関数の型宣言が全くいらず,いきなり行列を代入することができるのがむちゃくちゃ楽なんだけど。
でもアルゴリズムに集中できるというのはいいね。ちょっとインストールしてみようかな。

 

88: 名無しのシステムエンジニアさん 2019/01/13(日) 13:26:16.43 ID:Ev0OzgOy

>>86
for loop使わずに行列計算したほうが早いのはpythonも同じ。
裏でどういう処理してるか考えれば分かると思うが。

pythonのnumpyっていう実質的な標準ライブラリを入れると、
MatlabやRと同じ行列演算ができるようになる。

matlab、R、python一通り使ってきたけど、
計算するだけならmatlabが一番楽だね。
環境が製品として閉じてるから。
pythonはプログラミングより環境構築が難しい。

 

91: 名無しのシステムエンジニアさん 2019/01/13(日) 14:06:41.60 ID:4VcpaMum

>>88
>>89
ありがとう。つまり年間10万くらいMathworksにお布施してるのは意味があるってことか。
まあ,俺が作ったFFTのCのプログラムよりインタプリタのMatlabのFFTのほうが速かったときは
びっくりしたもんな。やっぱり売り物はよくできてるってことか。

>>90
お前はマシン語でもやってろ。何でもできるぞ。

 

37: 名無しのシステムエンジニアさん 2019/01/12(土) 21:44:28.59 ID:bl6GrAb2
Python簡単で便利だしな
情報工学の基礎を学んでない人でも扱える

 

49: 名無しのシステムエンジニアさん 2019/01/13(日) 00:13:11.03 ID:tG0QmgRX

クルマに例えるなら、日本でプログラマといって連想する人たちはタクシーやトラックの運転手に当たる。

で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。
クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、
タクシーやトラックの運転手しかないから国民は
「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」

あろうことか、そのトラックやタクシーの運転手たちが
「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。
トヨタの開発者?俺たちより運転してないだろ」
とメーカーの社員よりえらぶってる状況。それが日本のIT業界。

 

51: 名無しのシステムエンジニアさん 2019/01/13(日) 00:34:59.99 ID:T2tvEFxv
>>49
分かる。
データサイエンティストとか聞いて、てっきり計算科学やってる人の事かと思ったら、
只の技術屋じゃん。
サイエンティストって。。。

 

52: 名無しのシステムエンジニアさん 2019/01/13(日) 00:42:52.73 ID:VgsFpufp
なんで電子マネーみたいに無駄にポコポコ新言語作るんだ?

 

53: 名無しのシステムエンジニアさん 2019/01/13(日) 00:53:09.41 ID:Ci4YzD6F

>>52
AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、
プログラミングのパラダイムが変遷して、その変化に合わせたりとか、
プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。

ただpythonは結構古い。もうすぐ30年になる。

 

55: 名無しのシステムエンジニアさん 2019/01/13(日) 01:00:22.03 ID:yQoop5da
いやだからさ、アセンブラレベルで最適化したCモジュールやフレームワークを提供する側の人間かと思ったら
そのへんのプログラマ同様、pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
これでサイエンティストとか名乗られても、ただのプログラマじゃん

 

58: 名無しのシステムエンジニアさん 2019/01/13(日) 01:06:10.32 ID:rk6nPjSo
>>55
一行目がプログラマで、サイエンティストはエンドユーザーかと

 

61: 名無しのシステムエンジニアさん 2019/01/13(日) 01:33:54.48 ID:LP8DwHKq

>>55
> アセンブラレベルで最適化したCモジュールやフレームワークを提供する
これはエンジニアの仕事。サイエンティストの仕事では無い。

> pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
サイエンティストはプログラミング能力で評価されるわけでは無い。
データサイエンティストならデータから有用な結果を引き出せるかどうかが評価のポイントだろ。

 

99: 名無しのシステムエンジニアさん 2019/01/13(日) 17:09:33.65 ID:d2U21Etj

>>61
>データから有用な結果を引き出せるかどうか

ホントにな
言語とか正直どうでもいいだろ
カンタンにミスなく書けてデータが取り回せれば
・・・行きつくとpハックの話もあるけど(白目

 

64: 名無しのシステムエンジニアさん 2019/01/13(日) 02:17:11.65 ID:BC+9xAcO

データサイエンティストはエクセルも作るし、プレゼンもするぞ。モデルも作る

てか、エクセル作るためにモデル必要だし
エクセル作るだけの仕事なんてまずないだろ。それじゃただのコンサルじゃないの?

クライアントに寄り添ってデータ分析するのがデータサイエンティスト
彼らの実装をよりエレガントにエフェクティブにするのが機械学習エンジニア
その実装や必要なデータ整備を分散化、自動化するのがデータ基盤エンジニア

実際ははっきりとは分かれず
兼務してることが大半だと思う
特にデータサイエンティストと機械学習エンジニア

 

65: 名無しのシステムエンジニアさん 2019/01/13(日) 02:29:01.95 ID:caw1iggm

データアナリスト = データを分析して傾向を割り出す
データサイエンティスト = データを分析して予測を立てる
機械学習エンジニア = 鑑別器の正解率を高めるように特徴量を際立たせる

こんな感じか?

 

83: 名無しのシステムエンジニアさん 2019/01/13(日) 12:40:47.79 ID:4VcpaMum
今メインはMatlab+Statistical Toolboxで計算してて,たまにR使うくらいなんだけど,
Pythonに置き換えるってのはなんかメリットある?
やってるのはMCMCとかの1000行くらいから10000行くらいの計算。
Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。

 

89: 名無しのシステムエンジニアさん 2019/01/13(日) 13:31:25.77 ID:Ev0OzgOy

>>83
別にMatlabで何の問題なくできてるなら、問題はない。

Pythonが好まれてるのはオープンだから。
Matlabは商用ソフトなんで誰でも使えるわけじゃない。
あなたが書いたコードを共有するときに問題になる。

新しいアルゴリズムがデファクトで、
pythonで実装されるようになりつつあるから、
次第にpythonを使わざるをえなくなる機会は増えていく

 

94: 名無しのシステムエンジニアさん 2019/01/13(日) 15:39:11.20 ID:pSQYDZ7L

>>89
計算するだけならmatlabやRで良い事に同意

その計算モジュールをWebAPIやMQ等で他のモジュールと連携させたり、MongoDBやRedis等のDBを読み書きしたりと、システム化してAIにするには、pythonの方が便利

要は、バッチでデータ処理してた時代から、クラウドでAIする時代に変わり、pythonがトップになったんだと思う

 

90: 名無しのシステムエンジニアさん 2019/01/13(日) 13:57:47.62 ID:D4GElc6G
全部VBでできるだろ
VB.NETを使えっての
てか、データサイエンティストって何なんだよ

 

93: 名無しのシステムエンジニアさん 2019/01/13(日) 15:07:18.43 ID:K7d3Qawg
では、>>90は我々低レベルプログラミング勢が貰い受ける
まずIntelの仕様書を渡すところから始める
 
 
Left Caption

管理人コメ

システムエンジニアやプログラマって呼ばれるよりも高級な感じがしますね。

Posted by flac