본문 바로가기
Problem Solving/Programmers

Programmers - 불량 사용자[파이썬(python)]

by Deeppago 2022. 1. 24.

문제 출처 : https://programmers.co.kr/learn/courses/30/lessons/64064

 

코딩테스트 연습 - 불량 사용자

개발팀 내에서 이벤트 개발을 담당하고 있는 "무지"는 최근 진행된 카카오이모티콘 이벤트에 비정상적인 방법으로 당첨을 시도한 응모자들을 발견하였습니다. 이런 응모자들을 따로 모아 불량

programmers.co.kr

 

문제 설명

개발팀 내에서 이벤트 개발을 담당하고 있는 "무지"는 최근 진행된 카카오이모티콘 이벤트에 비정상적인 방법으로 당첨을 시도한 응모자들을 발견하였습니다. 이런 응모자들을 따로 모아 불량 사용자라는 이름으로 목록을 만들어서 당첨 처리 시 제외하도록 이벤트 당첨자 담당자인 "프로도" 에게 전달하려고 합니다. 이 때 개인정보 보호을 위해 사용자 아이디 중 일부 문자를 '*' 문자로 가려서 전달했습니다. 가리고자 하는 문자 하나에 '*' 문자 하나를 사용하였고 아이디 당 최소 하나 이상의 '*' 문자를 사용하였습니다.
"무지"와 "프로도"는 불량 사용자 목록에 매핑된 응모자 아이디를 제재 아이디 라고 부르기로 하였습니다.

예를 들어, 이벤트에 응모한 전체 사용자 아이디 목록이 다음과 같다면

다음과 같이 불량 사용자 아이디 목록이 전달될 경우,

불량 사용자에 매핑되어 당첨에서 제외되어야 할 제재 아이디 목록은 다음과 같이 두가지 경우가 있을 수 있습니다.

이벤트 응모자 아이디 목록이 담긴 배열 user_id와 불량 사용자 아이디 목록이 담긴 배열 banned_id가 매개변수로 주어질 때, 당점에서 제외되어야 할 제재 아이디 목록은 몇가지 경우의 수가 가능한지 return 하도록 solution 함수를 완성해주세요.

제한 사항

  • user_id 배열의 크기는 1 이상 8 이하입니다.
  • user_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    • 응모한 사용자 아이디들은 서로 중복되지 않습니다.
    • 응모한 사용자 아이디는 알파벳 소문자와 숫자로만으로 구성되어 있습니다.
  • banned_id 배열의 크기는 1 이상 user_id 배열의 크기 이하입니다.
  • banned_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    • 불량 사용자 아이디는 알파벳 소문자와 숫자, 가리기 위한 문자 '*' 로만 이루어져 있습니다.
    • 불량 사용자 아이디는 '*' 문자를 하나 이상 포함하고 있습니다.
    • 불량 사용자 아이디 하나는 응모자 아이디 중 하나에 해당하고 같은 응모자 아이디가 중복해서 제재 아이디 목록에 들어가는 경우는 없습니다.
  • 제재 아이디 목록들을 구했을 때 아이디들이 나열된 순서와 관계없이 아이디 목록의 내용이 동일하다면 같은 것으로 처리하여 하나로 세면 됩니다.

 

입출력 예

문제 풀이

먼저 이문제는 조합을 사용하여 푸는것이 아닌 순열을 사용하여 풀어야 한다 그 이유는 banned_id가 [ fr*d*, *rodo ]인 경우 [ fradi, frodo ]도 제재 아이디가 될 수 있지만, 만약 위 예시의 user_id에서 조합을 구하여 매칭 하게 되면 일반적으로 리스트의 앞에서부터 순차적으로 조합을 생성하기 때문에 [ frodo, fradi ] 조합은 생성될 수 있지만 [ fradi, frodo ] 조합은 생성되지 않는다. 

[ frodo, fradi ]조합은 banned_id에서 fr*d*와 frodo가 매칭 되지만 *rodo는 fradi와 매칭 되지 않으므로  [ fradi, frodo ]가 제재 아이디의 후보군이 될 수 있음에도 불구하고 이를 고려할 수 없다. 때문에 모든 경우의 수를 고려하기 위해선 조합이 아닌 순열을 사용하여야 한다.

 

제한 사항에서 user_id 배열의 크기는 1이상 8 이하이고, banned_id의 크기는 1 이상 user_id배열의 크기 이하이다. 배열의 기본적인 크기가 작기 때문에 user_id에서 banned_id의 크기만큼 순열을 구해 banned_id와 매칭 하여 조건에 맞는 순열 값을 count 하여 답을 구할 수 있다. user_id와 banned_id의 길이가 모두 8인 경우 8! 개의 순열이 생기므로 대략 4만 개의 순열마다 8번의 비교를 수행하면 답을 구할 수 있다.

 

생성된 순열과 banned_id간의 비교는 정규표현식을 사용하였는데 *을 \w로 바꾸어 매칭을 하게 되면 banned_id 각 요소마다 만족하는 문자열을 매칭 시킬 수 있다. 이때 주의해야 할 점은 길이이다. 예를 들어 fr*d*를 매칭 한 경우 frodoc도 매칭이 되기 때문에 match 오브젝트의 span 메서드를 호출하여 길이가 맞는지 확인해주어야 한다.

 

이러한 과정을 거치면 순열을 구하여 매칭 하였기 때문에 제재 아이디가될 후보군중에 중복되는 것이 있을 것이다. 예를 들어 banned_id가 [ *rodo, *rodo ]인 경우 [ frodo, crodo ], [ crodo, frodo ] 2가지 모두 후보군이 된다. 하지만 이는 순서만 바뀌었을 뿐 동일한 제재 아이디 이므로 이런 중복을 제거하여야 한다. 중복을 제거하는 방법은 간단하게 각각의 후보군을 정렬하여 이미 후보군에 들어있는 경우엔 count하지 않으면 된다.  

 

구현 코드

import re
import itertools

def solution(user_id, banned_id):
    n = len(banned_id)
    candidate = []
    count = 0
    for permut in itertools.permutations(user_id, n):
        tmp = []
        for idx, u_id in enumerate(permut):
            match = re.match(banned_id[idx].replace('*', '\w'), u_id)
            if match and match.span()[1] == len(u_id):
                 tmp.append(u_id)
        if len(tmp) == n:
            tmp.sort()
            if tmp not in candidate:
                candidate.append(tmp)
                count += 1
    
    return count

 

댓글