티스토리 뷰

반응형

[mongoDB] mongoDB Json 데이터베이스 가져오기(나무위키 덤프 데이터)

import namuwiki dump database


  나무위키 덤프데이터 다운

https://namu.wiki/w/%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4:%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4%20%EB%8D%A4%ED%94%84

위 링크에서 나무위키 json 데이터 덤프 파일을 다운 받는다.


위 페이지에서도 명시해 놓았지만 나무위키를 크롤링해서 서버부담을 주는 것을 방지하고 빅데이터 분석이나 개인소장에 용이하게 파일을 제공하고 있다.


압축을 풀고나면 약 6.7G의 json 파일이 나온다.



  mongoDB에 import 하기

압축을 풀고나면 약 6.7G의 json 파일이 나온다.


mongoDB 데몬을 실행한다.

mongoimport --db "DB 이름" --collection "collection 이름" --type json --drop --file "해당 파일까지의 경로" --jsonArray


mongoDB의 bin 폴더에 mongoimport.exe 파일이 있다. 

해당 파일로 DB이름을 설정하고  collection 이름을 설정하고 위 에서 설명된 옵션을 추가하면 import가 된다.



※ 실제 적용 예)

mongoimport --db namudb --collection namudbcollection --type json --drop --file "c:\user\download\namuwiki_161031.json" --jsonArray


반응형
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함