Database
 sql >> Teknologi Basis Data >  >> RDS >> Database

Cara Menutupi Cassandra dengan IRI FieldShield

PERBARUI:Q2’17 :Termasuk driver JDBC dan ODBC, dan penanganan JSON asli yang tertunda dapat membuat koneksi lebih cepat dan lebih mulus daripada pendekatan yang ditunjukkan di bawah ini. Anda Anda juga dapat menggunakan edisi Hadoop dari IRI Voracity untuk menutupi data di HDFS secara langsung. Data yang diekspor dengan cara di bawah ke flat-file di HDFS dapat disembunyikan di tingkat lapangan dari modul FieldShield Voracity dengan cara yang sama seperti yang ditunjukkan di bawah ini melalui MapReduce2, Spark, Spark Stream, Storm atau Tez tanpa pengkodean tambahan.

PERBARUI:Q3’19 :Sekarang tersedia di IRI DarkShield adalah konektor bawaan bawaan untuk Cassandra dan MongoDB yang tidak memerlukan langkah ekspor/mask/impor, dan dapat menangani data pengumpulan semi dan tidak terstruktur. Seperti FieldShield, DarkShield juga tersedia (termasuk) dalam langganan platform Voracity. Lihat artikel petunjuk ini untuk menemukan dan menutupi PII yang mengambang di Cassandra NoSQL DB. Jika Anda tertarik untuk mengisi Cassandra dengan data pengujian sintetis, lihat artikel ini.

DataStax / Cassandra tidak dapat menutupi kolom tertentu untuk menghentikan pengguna yang tidak sah melihat informasi identitas pribadi (PII). Dalam artikel ini, kami akan menunjukkan cara mengekspor data dari database Cassandra ke file CSV, dan menggunakan produk IRI FieldShield (juga tersedia di platform IRI Voracity) untuk mengacak, menutupi, dan mengenkripsi data dalam file CSV tersebut. Kemudian kami akan mengimpor data itu kembali ke Cassandra, diperbarui dan dilindungi. Artikel lainnya direncanakan setelah rilis koneksi IRI yang lebih langsung ke DB.

Dalam contoh kami, kami memiliki tabel dengan informasi siswa di DataStax. Kolomnya adalah:id_num (kunci utama), honors, semester_hours, socsecnum (nomor jaminan sosial), dan user_id.

Untuk menghapus identitas setiap siswa, kami akan mengacak jam_semester mereka, menutupi socsecnum mereka, dan mengenkripsi nilai user_id sehingga PII setiap siswa terlindungi.

Data tidak terlindungi di Cassandra

Untuk contoh baris perintah kami, kami menggunakan shell DataStax Cassandra CQL.

Mengekspor tabel Cassandra ke file CSV

Untuk mengekspor tabel Cassandra ke file CSV, jalankan perintah berikut dari shell Cassandra CQL:

COPY <Exporting Table> TO '<File Path to the CSV you exporting to>' WITH HEADER=TRUE;

Membuka dan Menentukan Sumber CSV

  1. Dari bilah alat atas GUI Workbench IRI untuk FieldShield (dibuat di Eclipse), temukan ikon FieldShield dan pilih 'Pekerjaan Lindungi Baru' untuk menjalankan wizard. Beri nama file pekerjaan Anda, “CassShieldJob.fcl” dan klik ‘Berikutnya’.
  2. Klik 'Tambahkan Sumber Data', lalu 'Jelajahi' ke file CSV yang Anda buat dengan ekspor Anda. Kemudian klik 'OK'.
  3. Klik ‘Temukan Metadata’ dan beri nama (file definisi data yang dapat digunakan kembali) “StudentsMeta.ddf” dan klik ‘Berikutnya’. Klik 'Ya' untuk mendeteksi otomatis dan "Dapatkan nama bidang dari baris header' sebelum mengklik 'Oke', lalu 'Selesai'.
  4. Anda sekarang akan melihat bidang Anda di daftar Sumber Data. Klik 'Berikutnya'.

Menerapkan Perlindungan

  1. Klik 'Tambahkan Target Data' dan jelajahi untuk membuat target file CSV baru untuk menyimpan versi data yang dilindungi (atau untuk menimpa sumber, gunakan jalur/file yang sama. Kemudian klik 'Bidang Target Layout', untuk meninjau tata letak dan menerapkan perlindungan ke bidang keluaran. Ada dua kotak daftar; bagian atas menunjukkan bidang sumber, dan bagian bawah menunjukkan bidang target tempat Anda akan menerapkan bidang "perisai".
  2. Acak semester_hours: Pilih nama kolom semester_hours di panel target dan klik 'Field Protection”. Pilih Random Value Generation, dan untuk tipe, pilih Digit. Setel ukuran minimum dan maksimum acak ke 2 dan klik OK.
  3. Mask socsecnum:Pilih bidang socsecnum dan klik 'Field Protection' lagi. Pilih Masking, dan pilih opsi USA SSN default untuk hanya menampilkan empat digit terakhir SSN. Klik 'Oke'.
  4. Enkripsi user_id:Pilih user_id dan  klik 'Field Protection' lagi. Pilih Enkripsi dan Dekripsi, lalu pilih enc_fp_aes256_alphanum untuk enkripsi pelestarian format. Masukkan frasa sandi (kunci dekripsi) dan di kotak Kecualikan ketik “Pengguna_” untuk mencegah bagian Pengguna_ dari nama pengguna kami dienkripsi, Kemudian klik ‘Selesai’.
  5. Bidang yang akan dilindungi akan muncul sebagai berikut:

Klik 'OK', lalu 'Selesai' untuk melihat skrip (pekerjaan yang dapat dieksekusi) sebenarnya yang dibuat untuk Anda:

Jalankan pekerjaan di IRI Workbench atau di baris perintah,

fieldshield /spec=CassShieldJob.fcl

File CSV yang Anda buat akan berisi data baru yang disamarkan dan dienkripsi.

Mengimpor data yang dilindungi ke Cassandra

Untuk mengimpor kembali data yang diubah ke Cassandra, gunakan perintah berikut di shell Cassandra CQL:

COPY <Table you are importing data to> (field1fromCSV, field2fromCSV, ...) FROM '<Path to CSV>';

Data yang dilindungi di Cassandra

Untuk detail tentang kemampuan FieldShield, lihat http://www.iri.com/products/fieldshield/technical-details.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SQL, membuat tabel

  2. KUNCI SQL

  3. Cara Mendapatkan Catatan dari 30 Hari Terakhir

  4. Pengenalan Pola Baris dalam SQL

  5. Cara Menutupi Tabel dan Mempertahankan Integritas Referensial