CSVとは、Comma-Separated Valuesの略語のことです。CSVはテキストデータの形式の1つであり、カンマ(,)で項目を区切って記述されます。CSVのファイル拡張子は「.csv」であり、レコードとして複数の項目をまとめる場合は、改行を用いてレコードを示します。
CSVでは、表のように、縦横に並んでデータを記述することが可能です。各種ITツール、システム、データベースソフトでCSVは標準対応されており、システムとシステムの互換性にも非常に優れています。
互換性に優れているので、システム間でCSVファイルをインポートすることもできます。たとえば、GoogleアナリティクスのキーワードデータをCSVファイルでダウンロードし、Googleスプレッドシートにインポートするケースです。大半のデータベースソフトやシステムがCSVファイルに対応しているので、適切に使用することで業務効率化に繋げられることは間違いありません。
CSVは、記述が非常に容易なテキストデータです。そのため、プログラムの対応も容易であり、人間が直接CSVファイルの内容を変更することも可能です。ただし、カンマを使って項目を限る方法は一般的ではあるものの、それ以外の仕様に関しては、記述者によって異なることが多いです。具体的には、CRLF(0x0D+0x0A)を改行文字として用いるケースが多いものの、テキストデータの扱いによってはLF(0A)やCR(0D)を用いるケースもあります。
改行でレコードを区切る形式は他にも存在する
CSVの他にも、改行でレコードを区切る形式は存在します。なお、どの形式であっても、改行までの1行のことをレコードと表します。代表的な例としては、TSV(Tab-Separated Values)形式が挙げられます。TSV形式はタブ文字(0x09)で区切ります。他にも、SSV(Space-Separated Values)形式も項目をレコードで区切るテキストデータの代表例であり、SSVはスペース文字(0x20)で区切ることが特徴です。
桁を区切る際にカンマを使用する西欧の一部では、セミコロン(;)をカンマの代わりとして使用することがあります。
CSVファイルとExcelファイルの違い
CSVを扱うにあたって、よく挙げられることの多い悩みが、CSVファイルとExcelファイルの違いが分からないということです。CSVはここまで解説したとおりの内容ですが、Excelファイルの拡張子は「.xlsx」になります。そのため、まず拡張子自体がCSVファイルとExcelファイルでは異なります。
CSVファイルは互換性が非常に優れているものの、Excelファイルは互換性が優れていません。これらの特徴から、クライアント(顧客)がExcelファイルを扱えるのか不明な場合には、互換性の優れたCSVファイルでデータのやり取りを行うことが多いです。
ただし、Excelファイルは編集機能や装飾機能が優れています。複雑なデータをまとめたり、視覚的に美しいレポートを作成したりする際はExcelファイルが使われることが多いです。また、Excelファイルでは関数を使うことも可能であるため、企業の予実管理表で用いられるケースも増えています。
参考記事
・Google Analytics(グーグルアナリティクス)とは?設定方法や使用用途を解説
・Googleスプレッドシートとは?機能や使い方、マーケティングでの活用法を解説します!
関連用語
・IT