본문 바로가기
알고리즘

2021 KAKAO BLIND RECRUITMENT 순위 검색 (python, 파이썬)

by 블쭌 2021. 2. 12.
728x90
  • 문제 설명

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

  • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
  • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

* [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?


  • 문제

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.


  • 제한사항
    • info 배열의 크기는 1 이상 50,000 이하입니다.
    • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 개발언어 직군 경력 소울푸드 점수 형식입니다.
      • 개발언어는 cpp, java, python 중 하나입니다.
      • 직군은 backend, frontend 중 하나입니다.
      • 경력은 junior, senior 중 하나입니다.
      • 소울푸드는 chicken, pizza 중 하나입니다.
      • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • query 배열의 크기는 1 이상 100,000 이하입니다.
    • query의 각 문자열은 [조건] X 형식입니다.
      • [조건]은 개발언어 and 직군 and 경력 and 소울푸드 형식의 문자열입니다.
      • 언어는 cpp, java, python, - 중 하나입니다.
      • 직군은 backend, frontend, - 중 하나입니다.
      • 경력은 junior, senior, - 중 하나입니다.
      • 소울푸드는 chicken, pizza, - 중 하나입니다.
      • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
      • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
      • 예를 들면, cpp and - and senior and pizza 500은 cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?를 의미합니다.

  • 입/출력
info query result
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"] [1,1,1,1,2,4]

  • 코드
import re

def solution(info, query):
    re.compile("[^0-9]")
    information = []
    for i in info:
        information.append(i.split(' '))
    
    answer = []
    for i in query:
        temp = i.split(' and ')[:-1]
        temp.append("".join(p.findall(i.split(' and ')[-1])).strip())
        score = re.findall('\d+', i)
        count = 0
        
        for j in information:
            value = 1
            if int(j[-1]) >= int(score[0]):
                for a, b in zip(temp, j[:-1]):
                    if a == '-':
                        continue
                    value *= (a == b)

                if value == 1:
                    count += 1
        answer.append(count)
    
    return answer

처음에 주먹구구식으로 문제를 풀었으나 역시 처음 문제에 효율성도 체크한다는 말이 있어서 불안했지만 역시나 일일히 query조건마다 체크하다보니 시간초과가 떴다... 고려를 해보았으나 아이디어가 떠오르지않아 카카오 설명과 다른사람의 코드를 조금 참고했다! dictionary를 생각했으나 key를 어떻게 넣어야할지 감이 안와서 포기했는데 새로운 방법을 배울 수 있었던 것 같다.

import bisect

def make_cases(idx):
    global changes, temp
    if idx == 4:
        new = []
        for i in temp:
            new.append(i)
        changes.append(new)
        return 
    
    for i in (False, True):
        temp.append(i)
        make_cases(idx+1)
        temp.pop()
    

def search(scores, num):
    size = len(scores)
    return size - bisect.bisect_left(scores, num, lo=0, hi=size)

def solution(info, query):
    global changes, temp
    answer = []    # 정답
    changes = []   # True, False 저장
    temp = []       # DFS를 위한 임시 리스트
    dic = {} # key:정보, value:score
    
    # DFS를 통해 changes 배열 채워넣기
    make_cases(0)
    
    # query를 위한 info 전처리
    for data in info:
        data = data.split()
        score = int(data[-1])
        data = data[:4]
        
        for change in changes:
            # 데이터 복제 -> 원본 데이터 유지
            _data = [x for x in data]
            
            # change배열에 따라서 True -> '-' / False -> 원본데이터 변경
            _data = ['-' if change[i] else _data[i] for i in range(4)]
            
            # 한줄로 이어붙여서 dictionary key로 사용
            _data = ''.join(_data)
            
            # key를 정보 value를 score
            # 중복될 경우를 대비해서 value를 list로 저장
            if _data not in dic.keys(): 
                dic[_data] = [score]
            else: 
                dic[_data].append(score)
    
    
    # info_dict[key] 정렬
    # -> 정렬을 해주는 이유는 나중에 binary tree를 사용하기 위해서이다!
    for key in dic.keys(): 
        dic[key].sort()
   
    
    for q in query:
        q = q.split()
        score = int(q[-1])
        
        # query 문자열 처리
        string = ''.join([x for x in q[:-1] if x != 'and'])
        
        # binary search tree를 사용해 정답 구하기
        if string in dic.keys():
            cnt = search(dic[string], score)
            answer.append(cnt)
        else:
            answer.append(0)

    return answer

 

코드에 주석을 달아놓았으나 이해가 안되는 사람을 위해 부연설명을 하려고합니다.

 

먼저 (언어/직군/경력/소울 푸드)에 대한 4가지를 선택한다. 해당 문제가 고려해야할 부분은 바로 '-'부분이다. 이 '-'는 조건을 신경쓰지 않는다는 뜻이기 때문이다.

이에 해설은 미리 여러가지의 경우의 수를 다 대비해놓는것이었다. 이는 make_cases함수를 보면 DFS를 통해 True, False 총 2^4=16가지의 경우를 미리 만들어 놓은 것이다. 이렇게 만들게 되면 이후 True일 경우 '-' / False일 겨우 원본데이를 통해서 여러가지의 경우의수를 다 대비해놓는것이다.

즉 언어가 'java', 직군이 'backend',  경력 'junior',  소울 푸드 'chicken'일 경우

javabackendjuniorchicken

-backendjuniorchicken

--juniorchicken

---chicken

----

등등 총 16가지의 경우를 다른 key로 value는 모두 같은 score로 미리 mapping 시켜놓는것이다! 여기까지 왔으면 아마 이해가 되었을것이라고 생각합니다!


  • 출처

programmers.co.kr/learn/courses/30/lessons/72412

728x90

댓글