(1)提出データの選択
ディスカバリの実作業の前には、開示対象となる人物や部署から関連するデータを選択していく作業が行われる。その際には、隠蔽等の疑いがかけられないように選択した理由が明確になるようにデータマッピングを実施して図解できるようにしておくことも重要である。
(2)証拠保全
訴訟が提起されると合理的に判断した時点から企業が所有する情報の中で訴訟に関係する全てのデータを改ざんまたは消去しないように維持する必要が生じる。これを訴訟ホールドやLitigation Holdと呼ぶ。
しかしながら、企業は業務を遂行しなければ存在できなくなるので、全ての状態を維持しておくことは実際には不可能である。そのため、関係あるデータをそのまま保全するために複製データを作成する。この作業は証拠保全と呼ばれ、証拠保全した後であれば元のデータは通常に使用することが可能となる。
証拠保全作業の実態は一言でいうと複製作業である。ただし、複製時に元のデータを破壊しない様、細心の注意を払う必要がある。なぜなら複製したデータが元のデータと完全に一致している事を証明しなければならない場合があるからである。FTC、ITC、SEC等の調査の場合には、その証明を求められることがあるので必要か否かを確認しなければならない。必要な場合には第3者である専門家に依頼するほうが安全である。
(3)データプロセス
証拠保全を実施したデータは弁護士がチェックして最終的に提出するべきかどうかを判断しなければならない。また同時に持っている情報から訴訟戦略なども検討していく。
しかしながら、証拠保全したデータは、そのほとんどが電子情報となっている現在、想像を絶するほどの量になっている。たとえば、1台のパソコンのデータをプリントアウトすると、トラック約4台分の書類になるといわれている。
もし50人分のデータを取るとトラック約200台分の書類になる。しかも、証拠保全では取りこぼしがないように安全を見て実際に必要なデータ量より多く取得しておくことが多い。これらの量は人が全部を閲覧できる量ではない。仮に何人もの弁護士を集めて証拠閲覧作業を行ったとしても、疲労による精度の低下はもとより、作業に要する弁護士に支払う費用は莫大なものとなる。
そこでこの一連の作業をハイテク技術を使って訴訟に関係ある情報だけを抽出し、データベース化することにより、弁護士による閲覧をより効率化する必要が生じる。この作業はデータプロセスと呼ばれる。
データプロセスにおいては訴訟に関連するデータを抽出するだけではなく、抽出したデータがどのCustodianのものでどのパソコン・サーバーのどのフォルダに入っていたか、及びメタデータリスト(ファイルの作成者、作成日時などの情報)などの抽出されたデータの情報リスト)を作成し、データベース化する必要がある。またキーワード検索の対象はデータの本文のみならず、表題やメタデータも全て検索対象に含まれる。
また、同時に多種類のアプリケーションの異なったデータセットを一つの形式にまとめてデータベースを作成するという複雑な作業が必要となる。これらの作業は訴訟の内容や企業の情報システムや後述するオンライン証拠閲覧システムの種類によって調整する必要が生じる。