「ビッグデータ」(ほぼ1TB、より小さい単位に分けることができます)を処理する必要があります。複数のプログラミング言語(Java、Python、C ++、Perl)、およびその他のスクリプトオプション(Perl、awk、sedなど)を検討し、次の場合にパフォーマンスを比較する方法を検討してください。
- データはファイルにあるので、読み取って処理するだけです。
- データはOracleサーバーにあるため、Oracleからインポートして処理してからOracleに戻す必要があります。
言語の構文的複雑さ(学習やプログラミングの難しさなど)は私の仕事にとって重要ではありません。主な質問は、I / Oを実行している人が他の人よりも優れているかどうかです。
ベストアンサー1
あなたが提案する内容は大量のデータのように聞こえますが、今日の基準では、データはほとんど必要ありません。私は職場でこの問題に取り組んでおり、どのディストリビューションでもこれを処理できます。
制限要因は物理ハードドライブ技術です。方程式の他のすべては「無関係」です。