Datalore:Pythonでのデータ分析のオープンベータ

こんにちは、Habr!



JetBrainsツールの補充で。 Pythonでデータを分析および視覚化するためのスマートWeb環境であるDataloreのオープンベータ版をリリースします。



機械学習は世界を確実に捉えます。データマイニングアルゴリズムは、現代の商業開発と研究の背後にあります。 機械学習の問題を簡単かつ快適に解決できるアプリケーションを開発しました。必要なすべてのデータサイエンスツールがすぐに使用でき、スマートPythonコードエディターがデータ分析プロセスを容易にします。







データロア機能



まず 、すべてのJetBrains製品と同様に、Dataloreは自動補完、構文の強調表示、検査を備えたスマートコードエディターです。







コードエディターの最も優れた機能はインテンションです。 タスクに応じて、関連するアクティビティが編集ウィンドウの下部に表示されます-「データセットの読み込み」、「トレーニングテストの分割」、「モデルの選択」など。 目的のアクションを選択すると、データセットまたはモデルをロードするためのコードがエディターセルに自動的に生成されます。 そして、結果はすぐに出力ウィンドウに表示されます。







自動補完と強度により、コードエディターでの作業が容易になります。 心配する必要がなくなり、データ分析とモデルパラメーターの選択に集中できます。



第二に 、インクリメンタル計算をサポートしています。パラメーターを選択したり、1つの行を置換したり、セルを追加したりするときに、ワークブック全体を最初から実行する必要はありません。 Dataloreは、編集に依存していた操作のみの計算を自動的に開始します。 すべての計算が自動的に開始されることを考慮すると、最も適切な数値と表は常に出力ウィンドウに表示されます。



さらに、Dataloreを使用すると、タスクに応じて異なるコンピューティングパワーにアクセスできます。







第三に、データを操作するための基本ライブラリ、機械学習アルゴリズムsklearnおよびディープラーニングpytorchアルゴリズムのライブラリから強力な視覚化ツールまで、1つのWebアプリケーションで基本的なデータサイエンスツールを収集しました。



ツールは本当に強力です。 datalore.plotライブラリは、Pythonで実装されたggplot言語R言語の類似物であり、datalore.geo_mapsモジュールは、インタラクティブマップの作成専用に設計されています。







データの操作を始めたばかりの場合は、事前定義されたデータセット(Iris、Titanic、MNIST)のいずれかをロードし、異なるモデルとパラメーターで遊んでください。 また、組み込みのファイルマネージャーを使用してデータをダウンロードできます。元の.csvファイルを保存し、対応する意図をクリックすることでパンダデータフレームに変換します。



Dataloreは、分析プロセス全体をクラウドに保存します。 作業は、すべてのワークブックの便利なファイルストレージから始まります。 ここから、同僚とワークブックへのリンクを共有し、問題を一緒に解決できます。Dataloreは複数のユーザーの同時操作をサポートします。







ワークブックへの変更は自動的に保存されます(データが絶望的に​​失われることはありません)。 問題が発生した場合は、以前の分析オプションにロールバックし、組み込みのバージョン管理システムを使用して変更の記録を追跡できます。







免許



パブリックベータモードでは、Dataloreは無料のコミュニティプランで利用できます。 将来的には、使用料はダウンロードしたデータの量と使用容量に依存します。



次は?



datalore.ioに登録して、最初のデータセットをロードしてください!



アナリスト、データサイエンティスト、研究者、学生など、機械学習タスクで頻繁かつ細心の注意を払って作業するすべての人から、Dataloreについての意見をお待ちしています。 最も便利なデータマイニングツールを作成し、フィードバックをお待ちしています。 製品に関するコメントを残すために私たちのフォーラムに書いて、私たちと他のユーザーに連絡してください。



upd 15.02複雑なアルゴリズムを起動し、より強力なコンピューティングインスタンスを使用し、「Surcharge limit



All Articles