데이터 분석 4

가입 고객 유형 예측 모델링

이 친구는 암호화를 요한다....하....#암호화를 위한 함수를 정의합니다.def encrypt(target): hashSHA=hashlib.sha256() #SHA256 해시 객체 생성 hashSHA.update(str(target).encode('utf-8')) #해시 값 생성 암호화 대상이 숫자형인 경우에는 문자로 변경해야 한다. return hashSHA.hexdigest().upper() #해시값 반환 #IS 컬럼의 값을 암호화 합니다.ansan_data['IS']=ansan_data['IS'].apply(encrypt)

데이터 분석 2024.11.15

네비게이션 도착시간 예측 모델링

1. 데이터 불러오기import pandas as pdimport numpy as npdf = pd.read_csv("onenavi_train.csv", sep="|")df_eval = pd.read_csv("onenavi_evaluation.csv",sep="|")# 학습/평가 데이터의 전처리 기준을 통일하기위해 데이터 합본df_total=pd.concat([df,df_eval],ignore_index=True)2. 추가 변수 생성import pandas as pddf_pnu = pd.read_csv("onenavi_pnu.csv",sep="|") # 주소(시도/시군구 정보)df_signal = pd.read_csv("onenavi_signal.csv",sep="|") # 경로의 신호등 갯수df_pnu..

데이터 분석 2024.11.15

악성 사이트 탐지 모델링

이런 식으로 html_code와 악성 사이트 의심 여부가 있다고 하자. Beautifulsoup를 사용해 html_code로부터 악성 사이트 여부를 알아내는 모델을 만들어 보자. 1. html 에서 길이 계산우리가 해야 하는 사항은 다음과 같다.- BeautifulSoup으로 html소스를 python 객체로 변환- 이걸 함수로 구현하기- float으로 return 받기import pandas as pdimport numpy as npfrom bs4 import BeautifulSoupfrom urllib.parse import urlparse# def html_script_characters(soup): # soup > script html_len = str(soup.script) # so..

데이터 분석 2024.11.15

데이터 전처리 python 코드

푸~하! 담배 한 모금 하고 데이터 분석! (비흡연자입니다.)1. 데이터 분석# 라이브러리 로드import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns#경고 메시지 무시import warningswarnings.filterwarnings("ignore", category=FutureWarning)#데이터 로드odf = pd.read_csv('titanic.csv') #쥬피터 노트북과 같은 위치일 경우# odf = pd.read_csv('./data/titanic.csv') #.은 현재위치# odf = pd.read_csv('./data/titanic_sep.csv')# odf = pd.read_csv(..

데이터 분석 2024.11.14