본문 바로가기

전체 글

(38)
Merge Sort Sorting algorithm divide & conquer algorithm 시간복잡도 각 층의 계산 시간 : 데이터 개수가 n일 때, 이를 정렬하는 데 cn의 시간이 걸린다고 해보자(c는 컴퓨팅 파워 등과 관계 있는 어떤 상수를 나타냄). 층의 수 : logn Big-O notation : O(nlogn) Python Code 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 def merge(left, right): result = [] while len(left) > 0 or len(right) > 0: if len(left) > 0 and len(right) > 0: if left[0] 0: result.app..
instagram images crawling 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 from selenium import webdriver import numpy as np import urllib import selenium from urllib.request import Request, urlopen import requests import time from bs4 import BeautifulSoup from urllib import request import pandas a..
Gensim Word2Vec Fine-tuning fine tuning은 이미 학습된 레이어의 parameter를 조금씩 수정을 하는 방식으로 이루어진다. 단, finetuning 시 추가되는 데이터의 속성과 양 혹은 레이어의 추가 여부 등에 따라 overfitting을 발생시킬 수 있기 때문에 모델의 기존 purpose와 performance를 그대로 유지하되 몇 가지만 추가할 목적으로 finetuning을 진행하는 것은 옳지 않은 선택일 수 있다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 ..
인스타그램 크롤러 #posted_texts, hashtags, ids, posted_time crawler #selenium, beutifulsoup 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 from selenium import webdriver import numpy as np import urllib import selenium from urllib.request import Request, urlopen import requests import time from bs4 import BeautifulSoup from urllib import request import panda..
Instagram Hashtag crawling using Selenium 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384import pandas as pdfrom selenium import webdriverimport numpy as npimport urllibimport seleniumfrom urllib.request import Request, urlopenimport requestsimport timefrom bs4 import BeautifulSoupfrom urllib import request search = input('검색어..
(연습)Multilingual-BERT를 이용해 크롤링한 영화 댓글 감성 분류 하기 #COLAB 1 2 3 4 5 6 7 8 #Crawling test(html 구조 파악하기) import requests from bs4 import BeautifulSoup test_url = "https://movie.naver.com/movie/bi/mi/pointWriteFormList.nhn?code=136990&type=after&page=1" resp = requests.get(test_url) html = BeautifulSoup(resp.content, 'html.parser') html 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 ..