MongoDB
 sql >> Teknologi Basis Data >  >> NoSQL >> MongoDB

Memasukkan bidang (kolom) baru ke mongoDB dengan panda

Metode yang Anda butuhkan adalah update_one() dengan upsert=True dalam satu lingkaran; anda tidak dapat menggunakan insert_many() karena dua alasan; pertama Anda tidak selalu memasukkan; kadang-kadang Anda memperbarui; kedua update_many() (dan insert_many() ) hanya bekerja pada satu filter; dalam kasus Anda, setiap filter berbeda karena setiap pembaruan berkaitan dengan waktu yang berbeda.

Ini adalah solusi umum yang akan menggabungkan kerangka data (df_a , df_b dalam hal ini - Anda dapat memiliki sebanyak yang Anda suka) dengan cara yang Anda butuhkan. Ini menggunakan iterrows untuk mendapatkan setiap baris kerangka data, memfilter tanggal, dan menyetel nilai ke dalam kerangka data. $set operator akan menimpa nilai jika sudah ada dan mengaturnya jika tidak disetel. upsert=True akan melakukan penyisipan jika tidak ada tanggal yang cocok.

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

Contoh kerja penuh:

from pymongo import MongoClient
from pprint import pprint
import datetime
import pandas as pd

# Sample data setup

db = MongoClient()['mydatabase']

data_a = [[datetime.datetime(2017, 5, 19, 21, 20), 96, 8, 98],
          [datetime.datetime(2017, 5, 19, 21, 21), 95, 8, 97],
          [datetime.datetime(2017, 5, 19, 21, 22), 95, 8, 97]]

df_a = pd.DataFrame(data_a, columns=['date', 'std_500_1000window', 'std_50_100window', 'std_50_2000window'])

data_b = [[datetime.datetime(2017, 5, 19, 21, 20), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 21), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 22), 98, 9, 10]]

df_b = pd.DataFrame(data_b, columns=['date', 'std_50_3000window', 'std_50_300window', 'std_50_500window'])

# Perform the upserts

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

# Print the results

for record in db.mycollection.find():
    pprint(record)

Hasil:

{'_id': ObjectId('5f0ae909df5531ac655ce528'),
 'date': datetime.datetime(2017, 5, 19, 21, 20),
 'std_500_1000window': 96,
 'std_50_100window': 8,
 'std_50_2000window': 98,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52a'),
 'date': datetime.datetime(2017, 5, 19, 21, 21),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52c'),
 'date': datetime.datetime(2017, 5, 19, 21, 22),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Gambar tidak dirender dari jalur gambar dinamis saat menggunakan paket html-pdf ekspres

  2. Pengindeksan pada bidang yang ada dalam larik subdokumen

  3. Mongoose - Mendefinisikan ulang struktur skema

  4. Bagaimana memodelkan banyak hubungan referensi diri dengan banyak orang tua?

  5. Isi + Agregat di Luwak