본문 바로가기
728x90

분류 전체보기158

백준 1922번: 네트워크 연결 (python, 파이썬) 문제 도현이는 컴퓨터와 컴퓨터를 모두 연결하는 네트워크를 구축하려 한다. 하지만 아쉽게도 허브가 있지 않아 컴퓨터와 컴퓨터를 직접 연결하여야 한다. 그런데 모두가 자료를 공유하기 위해서는 모든 컴퓨터가 연결이 되어 있어야 한다. (a와 b가 연결이 되어 있다는 말은 a에서 b로의 경로가 존재한다는 것을 의미한다. a에서 b를 연결하는 선이 있고, b와 c를 연결하는 선이 있으면 a와 c는 연결이 되어 있다.) 그런데 이왕이면 컴퓨터를 연결하는 비용을 최소로 하여야 컴퓨터를 연결하는 비용 외에 다른 곳에 돈을 더 쓸 수 있을 것이다. 이제 각 컴퓨터를 연결하는데 필요한 비용이 주어졌을 때 모든 컴퓨터를 연결하는데 필요한 최소비용을 출력하라. 모든 컴퓨터를 연결할 수 없는 경우는 없다. 입력 첫째 줄에 컴퓨.. 2020. 11. 17.
프로그래머스 완주하지 못한 선수 (python, 파이썬) 문제 수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다. 마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수들의 이름이 담긴 배열 completion이 주어질 때, 완주하지 못한 선수의 이름을 return 하도록 solution 함수를 작성해주세요. 제한사항 마라톤 경기에 참여한 선수의 수는 1명 이상 100,000명 이하입니다. completion의 길이는 participant의 길이보다 1 작습니다. 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자로 이루어져 있습니다. 참가자 중에는 동명이인이 있을 수 있습니다. 입/출력 participant completion return [leo, kiki, eden.. 2020. 11. 17.
RMSE, Grid Search python 구현 RMSE # RMSE 공식을 구현한 함수를 생성합니다. # 이 함수는 예측값(predict)과 정답(actual)을 인자로 받습니다. def rmse(predict, actual): # predict와 actual을 numpy array로 변환합니다. # 이렇게 하면 수학 연산을 편하게 할 수 있습니다. predict = np.array(predict) actual = np.array(actual) # 공식에 쓰여진대로 predict와 actual을 빼서 차이를 구합니다. # 이 차이를 distance라는 이름의 새로운 변수에 할당합니다. distance = predict - actual # 공식에 쓰여진대로 distance를 제곱합니다. # 이 결과를 square_distance라는 이름의 새로운 변수.. 2020. 11. 12.
Logistic Regression 데이터 불러오기(Setosa 제거 binary classfication 진행) import pandas as pd import numpy as np iris = pd.read_csv('iris_short2.csv') numpy 배열로 만들기 iris_np = iris.values Species순서로 정렬되어있기 때문에 random shuffle 진행 np.random.shuffle(iris_np) 독립변수 / 종속변수 iris_features = iris_np[:,:-1] # 독립변수 iris_labels = iris_np[:,-1] # 종속변수 종속변수 label Encoding from sklearn import preprocessing le = preprocessing.LabelEncoder() i.. 2020. 11. 12.
seaborn 시각화 python 모듈 불러오기 import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline seaborn안에 tips데이터 불러오기 # tips 데이터 불러오기 tips = sns.load_dataset('tips') # 데이터 확인 tips.head() relplot scatter plot # x : x축 column # y : y축 column # data : 사용할 data frame sns.relplot(x="total_bill", y="tip", data=tips) # hue(명목형) : 해당 변수를 기준으로 색깔 다르게 표시 sns.relplot(x="total_bill", y="tip", hue='sex', data=tips) # hue(.. 2020. 11. 12.
데이터 전처리 python 모듈 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline 데이터 불러오기 boston = pd.read_csv("data/boston_missing.csv") 데이터 shape 확인 boston.shape # (506, 20) 데이터 column 확인 boston.info() 요약 통계량 확인 * describe() 함수를 사용 * 수치형 변수에 관해서만 결과를 보여준다 * 결측치는 제거하고 계산해준다 boston.describe() 상관분석 * 수치형 변수중에서 각각 2개의 column씩 상관관계를 보여준다 * 값은 -1 ~ 1사이에서 존재한다 *.. 2020. 11. 12.
728x90