IT

ビッグデータの5Vとは何か

ビッグデータの5V

ビッグデータ(近年得られるようになったデータの総称)と従来のデータと4つの面で大きく異なります。4つとは、量・速さ・種類・正確さのことで、この4つに価値という指標を加えビッグデータの5Vと言われています。

今回はこの5Vについて説明してみたいと思います。

 

量(Volume)

情報技術が発達し、以前にも増してより多くのデータを集めることが可能になりました。ツイッターのメッセージやYouTubeの動画投稿、インスタグラムの画像など、次々とデータが増加しています。またIoTのような新規分野もビッグデータの対象となっています。

 

速さ(Velocity)

データが生み出される速さは現在と今日では全く異なります。先ほどツイッターやYouTubeを例に挙げましたが、以前は考えられなかった速さで新しい情報が生まれ続けています。

種類(Variety)

データの種類も変わりました。

以前は表や関係データベースにフィットする構造化されたデータがメインでした。しかし、今では画像や文書、動画や音声など非構造化データがメインになっています。為替の値動きや取引量などもビッグデータ分析の対象になりました。

 

正確さ(Veracity)

データの変化にともない、データの正確さが問題になってきました。Welq問題に代表されるフェイクニュースやソーシャルメディアを通して流れるデマ情報をいかに扱うかが問題になっています。

 

価値(Value)

上で紹介した4Vを活用して生み出されるものが価値です。

もし私たちがビッグデータを活用しても何も得られないとしたら意味がありません。その意味で、価値はビッグデータにおける最重要項目となっています。

 

まとめ

以上がビッグデータの5Vです。

ビッグデータの5Vはビッグデータ分析を始める前にぜひ知っておきたい概念です。

しっかりと要点を押さえましょう。

 

ビッグデータをうまく活用すると、セキュリティを強化したり、健康問題の解決につなげられたり、あるいはスポーツ選手のパフォーマンスを向上させたり、企業の業績を改善させたりすることができます。これは素晴らしいことですよね。

玉石混淆のデータの中からうまく有益な価値を見出すことができるかどうかが、現在のデータサイエンティストたちの大きな課題です。これからのビッグデータの活用に注目していきましょう!

 

 

ABOUT ME
てりたま
いつの間にかライターで生きるようになっていた人。真面目半分、不真面目半分で記事を書いてます。