Data.olllo ユーザーガイド
Data.olllo データアシスタントは、現在3つのコア(P Core、V Core、X Core)をサポートし、さまざまなタイプのデータファイルに対応する世界最高のデータソフトウェアを目指しています。
1. 基本ソフトウェア情報:
- 速度: 高速、非常に高速、極めて高速。
- コア:
P Core
: クラシックコア、最大数千万のデータセットに最適化。V Core
: 数十億のデータセットに最適で、大きなHDFSファイルで優れた性能を発揮。X Core
: 強化されたクラシックコア、テラバイト規模のデータに対応し、GPU加速とマルチスレッドをサポート。
- 対応データファイルタイプ:
P Core
とX Core
- 開くことができるファイル:
csv
,xlsx
,xls
,dbf
,json
,html
,xml
,clipboard
,h5
,hdf5
,hdf
,feather
,parquet
,dta
,sav
,pkl
,sas7bdat
,xpt
,sas
,spss
,table
,gbq
,fwf
,orc
。 - 保存できるファイル:
csv
,xls
,xlsx
,pkl
,clipboard
,json
,html
,xml
,latex
,h5
,hdf5
,hdf
,feather
,parquet
,orc
,dta
。
- 開くことができるファイル:
X Core
- 開くことができるファイル:
csv
,arrow
,hdf5
,parquet
,feather
,fits
,ascii
,json
,xlsx
,xls
,dbf
。 - 保存できるファイル:
arrow
,hdf5
,parquet
,feather
,fits
,csv
,xls
,xlsx
,json
。
- 開くことができるファイル:
- コア間でのファイルタイプ: 理論的には、P、V、Xコアはファイルを相互に開くことができます。最初に一つのコアでファイルを開き、次にCSVなどで保存して他のコアで使用できます。
- データファイルのサイズ: 大きい、非常に大きい、極めて大きいファイルに対応しています。Data.ollloのP Coreは数千万から数億行のデータを処理できます。データサイズが大きすぎて開けない場合、V CoreまたはX Coreに切り替えて、非常に大きなデータファイルを扱うことができます。ディスクスペースが十分であれば、あらゆるサイズのファイルを処理可能です。
- 対応ファイルエンコーディング: 必要なエンコーディングは何ですか? :) 任意のエンコーディングの手動入力に対応し、自動エンコーディング検出機能もあります。
- ツールボックスのオンラインアップデート: ツールボックスと「スーパーオプション」セクションのオンラインアップデートをサポート。
2. 基本的なソフトウェア機能:
- さまざまなファイルタイプを開く: 同じタイプまたは同じエンコーディングの複数のファイルをバッチで開くことができます。
- ファイルを開くときに結合: V Coreは、同じフィールドを持つ複数のファイルを1つに結合して開くことができます。複数のファイルを開いた後、PおよびX Coreでもファイルを1つに結合できます。
- さまざまなファイルタイプで保存: 詳細はサポートされているファイルタイプを参照してください。
- ファイルの分割と保存: ファイルをサイズやキーワードで複数の小さなファイルに分割して保存できます。
- ファイル分割: P CoreはV Coreほど大きなファイルを扱えませんが、ファイルを開かずに分割できます。
- 行と列の表示: 見やすくするために、特定の行と列を表示することができます。
- ファイルを閉じる: 保存せずにファイルを閉じることができ、複数のファイルをバッチで閉じることができます。
3. ソフトウェアのデータ処理機能:
- 柔軟な選択セット: すべて選択、選択解除、行選択、列選択。
- 基本情報: データセットの基本情報を表示。
- クイック統計: データセットの最大値、最小値、平均値などを迅速に計算。
- クイックソート: 1つまたは複数の列で並べ替え、列の順序に従って並べ替えます。順序を変更する場合は、最初に「2つの列を交換」機能を使ってください。
- 2列の交換機能: 2列を選択し、順番を交換します。
- 行の削除、列の削除: 選択した行または列を削除します。
- 列名の変更、列の型変更(文字列、整数、小数): 列名を変更したり、データ型を変更したりできます。
- 行を編集、行を挿入: 行を編集または挿入できます。
- 列を編集、新しい列を追加: 列を編集または新しい列を追加できます(数値型の+、-、*、/操作、文字列型の+操作がサポートされています)。
- レコード(行)のフィルタリング: データまたは文字列タイプに対して、「等しい」、「等しくない」、「より大きい」、「より小さい」、「以上」、「以下」などのフィルタリングルールに対応しています。
- ファイルの結合: 複数のファイルを縦に結合します。
- ファイルのマージ: 2つのファイルをキーワードで横にマージします。P Coreの場合、キーワード名は同じでなければならず(異なる場合は、「列名の変更」機能で同じにする必要があります)、V Coreの場合、キーワード名の制約はなくても、同名のフィールドを持つ2つのテーブルをマージすることはできません(最初に「列名の変更」で列名を変更してください)。
- データピボット: ピボットテーブルと同様に、行と列の列を選択し、内容と型を指定してピボットします(合計、平均などを一緒に表示することもできます)。行を選択せずに列だけ選択してもピボットを実行できます。
- 重複の削除: 重複データを識別して削除します。重複を保持または削除することができ、最初または最後の発生を保持するかを選べます。
- 重複の検出: 重複するデータエントリを識別します。
- グループ統計: キーワードでグループ化された合計、平均、最大、最小値などを提供します。
4. ソフトウェアのスーパーデータ処理機能
必ず言及すべきスーパー機能には、スーパーフィルタ、スーパー抽出、スーパー置換が含まれます。「スーパー」という言葉は、そのままの意味—スーパーです!これらは、通常の文字列だけでなく、ルール記述(正規表現)もサポートしています。正規表現については、視覚的に表現を確認できるツールも提供しており、正規表現を学ばずに使用したい方にも便利です。
これらのスーパー機能を使えば、検索、フィルタリング、置換、マッチング、内容の選択など、さまざまなタスクを簡単に処理できます!
- スーパーフィルタ:選択した列をフィルタリングし、その結果を同じデータテーブル内の新しいフィールドに保存できます。例えば、列内の電話番号をチェックしたい場合、電話番号の正規表現を選択して確認すると、その結果が保存されます。結果がTrueであれば電話番号があり、Falseであればありません。その後、「レコードフィルタ」の機能を使って、TrueまたはFalseを選択してフィルタリングされた行を抽出できます。
- スーパー抽出:選択した列から内容を抽出し、その結果を同じデータテーブル内の新しいフィールドに保存できます。例えば、列から電話番号を抽出したい場合、電話番号の正規表現を選択して確認すると、その結果が新しい列に抽出されます(列名を設定できます)。
スーパー抽出では、コンテンツを区切り文字として使用することもできます。例えば、異なる数字を使って列を分割したい場合、スーパー抽出内で区切り文字として数字の正規表現を選択して確認すれば、分割された内容が新しい列として表示されます。
- スーパー置換:一致したコンテンツを希望するテキストに置き換えることができます。例えば、電話番号を「139xxxxxx」に置き換えたい場合、列を選択して電話番号の正規表現を選び、置き換えるテキスト「139xxxxxx」を入力して確認すると、その結果が新しい列に保存されます。
スーパー機能には、ツールを試しながら理解できるように、視覚的な正規表現ジェネレーターも含まれています。Regex.ollloという正規表現ビジュアライザーもOllloシリーズの一部で、試してみるのが楽しいアプリケーションです。
5. ソフトウェアコマンドモード
このソフトウェアはPythonで開発されており、Pythonの文をサポートしています。データテーブルはdfとして表されます。プログラミングを知っている場合、そのまま文を書いて実行することができます。例えば、df.sample(5)
はランダムに5行を取得することを意味します。提供されている例を見れば、すぐに使い方がわかります。
コマンドモードは、基本的にプログラミングそのもので、何でもできます。
6. ツールマップと正規表現マップ
ツールマップと正規表現マップは定期的に更新され、手動での更新が必要です。各更新ごとに、さらに多くの機能が追加されます。
7. 全体的な機能レイアウト
8. UIテーマ
Data.ollloは、ユーザーの好みに合わせて2つの異なるユーザーインターフェーステーマを提供しており、体験を向上させます。クラシックUIはシンプルで使い慣れたレイアウトで、データ管理が簡単に行えます。さらにモダンでカスタマイズ可能な体験を提供するAdvanced UIは、LightおよびDarkテーマを備え、ディスプレイに合わせてスケーリングオプションも提供します。クラシックな外観を好む方にも、スリムでスケーラブルなデザインを好む方にも、Data.ollloは理想的なインターフェースを選択する柔軟性を提供します。
- Advanced UI(ダーク)
- Advanced UI(ライト)
- クラシックUI
バージョン詳細
利用可能なバージョン: 7.0以上