2, 3일차 공부 정리

파이썬 리스트

리스트

리스트 내 어떤 데이터 타입이든 들어갈 수 있습니다. 그림과 같이 리스트의 원소로 리스트가 들어갈 수도 있습니다.

이게 가능한 이유는 리스트 변수에는 리스트 주소값이 저장되기 때문입니다. 그러므로 형식이 자유로워 집니다.

a = [5,4,3,2,1]
b = [1,2,3,4,5]
b = a

# 같은 리스트 값을 복제하는 방식으로 b에 할당하고 싶을때
b = a[:] 

리스트2

다음 코드를 실행하게 되면(b = a) 컴퓨터 내부적으로 윗 그림과 같은 일이 벌어집니다. 두 변수 모두 서로 같은 리스트를 가리키게 되죠.

변수는 리스트를 입력받을 때 리스트의 주소 값을 할당하는 방식으로 입력받기 때문입니다.

같은 리스트를 할당하지 않고, 리스트를 복제하여 할당하고 싶을 때는 밑 코드(b = a[:])을 실행해야 합니다.

import copy

kor_score = [49, 79, 20, 100, 80]
math_score = [43, 59, 85, 30, 90]
eng_score = [49, 79, 48, 60, 100]
midterm_score = [kor_score, math_score, eng_score]

# 아래 식은 복제가 되지 않음. (일차원 리스트와 다릅니다.)
# midterm_copy = midterm_score[:]
# copy 패키지 내 deepcopy를 사용해야함.
midterm_copy = copy.deepcopy(midterm_score)

이차원 리스트는 일차원 리스트와 또 다르게 복제하려면 위와 같이 다른 방법을 사용해야 합니다.

파이썬 함수

Call by Reference

파이썬 함수 호출 방식은 ‘Call by Reference’ 입니다. 함수에 인자를 넘길 때 메모리 주소를 넘기고, 함수 내에 인자 값 변경 시 호출자의 값도 변경됩니다.

이 사실을 잘 모르고 있다면 함수를 사용한 코드를 디버깅 할 때 혼란스러울 수 있습니다.

개인적으로 예전에 코딩테스트 시험를 볼 때 함수를 거친 것 뿐인데 값이 도대체 왜 바뀌는 지에 대한 의문이 풀립니다.

def spam(eggs): # 인자로 넘어온 주소값을 eggs에 넣음.
    eggs.append(1) # 기존 객체의 주소 값에 [1] 추가.
    eggs = [2,3] # 새로운 객체 생성.

ham = [0]
spam(ham)
print(ham)  # 결과 : [0, 1]
# ham 값이 spam 함수를 거치니 달라졌음.

‘함수에 인자를 넘길 때 메모리 주소를 넘기고, 함수 내에 인자 값 변경 시 호출자의 값도 변경됩니다.’ 를 잘 보여주는 예시 코드 입니다.

스와핑

def swap_value(x, y):
    temp = x
    x = y
    y = temp

def swap_reference(list_ex, offset_x, offset_y):
    temp = list_ex[offset_x]
    list_ex[offset_x] = list_ex[offset_y]
    list_ex[offset_y] = temp

ex = [1,2,3,4,5]
swap_value(ex[0], ex[1])
print(ex) # [1,2,3,4,5], 리스트 값이 안 바뀐다.
swap_reference(ex, 0,1)
print(ex) # [2,1,3,4,5], 리스트 값이 바뀐다.

윗 함수는 변수 스와핑이 일어나지 않고 아랫 함수는 변수 스와핑이 일어납니다. 리스트 내 변수 스와핑을 할 때 유의해야 합니다.

또 참고할 점은 파이썬에서 연산 속도를 위해 자주쓰는 -5~256 까지의 숫자의 주소 값은 미리 할당했다는 것을 기억하면 좋겠습니다.

지역변수, 전역변수

다음으로 함수 내 변수를 새로 선언하면 지역변수로써 그 함수 내에서만 사용이 가능합니다. 함수 바깥에 있는 변수는 전역변수로써 함수에서도 차용해서 사용이 가능하구요.

다만 함수 내에 전역변수와 이름이 같은 변수를 선언하면 새로운 지역 변수가 생깁니다.

만약 함수 내에서 전역변수로 사용하고 싶다면 global 키워드를 이용하면 좋겠습니다.

def f():
    global s
    s = 'I love Hanam!'
    print(s) # 'I love Hanam!'

s = 'I love Seoul!'
print(s) # 'I love Seoul!'
f()
print(s) # 'I love Hanam!'

가변인자

개수가 정해지지 않는 변수를 함수의 파라미터로 사용할 때 사용합니다.

Asterisk(*) 기호를 사용하고 가변인자는 맨 마지막 파라미터 위치에서 한 개만 사용 가능합니다. 그리고 입력된 값은 튜플로 사용됩니다.

또 Asterisk(*) 기호를 2개 사용하는 키워드 가변인자도 존재합니다. 입력 값은 dict 타입을 사용해야합니다.

def asterisk_test(a, b, *args):
    return a+b+sum(args)

def kwargs_test_3(one,two, *args, **kwargs):
    print(one+two+sum(args))
    print(kwargs)

print(asterisk_test(1, 2, 3, 4, 5))
kwargs_test_3(3,4,5,6,7,8,9, first=3, second=4, third=5)

일등함수

파이썬의 함수는 일등함수 입니다. 일등함수란 변수나 데이터 구조에 할당이 가능한 객체이고, 파라미터로 전달이 가능하며 리턴 값으로도 사용할 수 있어야 합니다.

개인적으로 이전에 R을 배웠었는데 R과 작동 원리가 똑같은 것 같습니다.

일등함수 성질을 사용하면 다음과 같은 응용이 가능합니다.

def print_msg(msg):
    def printer():
        print(msg)
    return printer

another = print_msg("Hello, Python")
another() # another 함수는 'Hello, Python'을 프린트 해주는 함수.
# 위와 같이 함수를 찍어내는 함수를 만들 수 있음. 이를 클로저 라고 함.

파이썬 내 알아두면 좋을 것들

docstring

docstring 이란? 함수에 대한 상세스펙을 함수명 아래에 작성하는 것 입니다.

vscode 내 docstring 을 설치하고 명령창에 docstring을 쓰면 쉽게 사용 가능합니다.

docstring

코딩 컨벤션

협업을 진행할 때 쉽게 이해하도록 개인의 코딩 습관을 자제하고, 정해진 코딩 규칙을 지키는 것 입니다.

일반적인 코딩 규칙으로

  • 들어쓰기 4칸
  • 한 줄은 최대 79자(화면 크기가 작은 사람 배려)
  • 불필요한 공백은 피함
  • 코드 마지막엔 항상 한 줄 추가

등이 있습니다.

참고로 파이썬 내 black 모듈을 사용하면 pep8 like 라는 수준을 준수하는 코드로 자동 변경 되니 협업 하는 경우 한번 돌리고 사용해도 좋을 것 같네요.

포멧팅

다른 포멧팅 방법도 많이 있고, 다른 사람의 코드를 해석하기 위해서 알긴 해야겠지만 f-포멧팅 방법이 가장 편한 것 같아 익숙해 지기 위해 기록합니다.

사용방법은 문자열 앞에 f를 붙이면 되며 {}로 변수 이름을 감싸면 됩니다.

name = 'Seong Yeon'
age = 25
print(f'Hello, {name}. You are {age}.')
# Hello, Seong Yeon. You are 25.

모듈

남의 코드를 빌려올 때 참 많이 쓰지만 모듈 불러오는 과정이 매일 햇갈려서 정리합니다.

  • import 모듈 as 별명
  • from 모듈 import 특정함수(또는 *)
  • from 폴더 import 모듈

collections

C++의 STL 처럼 파이썬 내 최적화 된 자료구조를 제공하는 모듈로 collections이 있습니다.

주로 쓰게 되는 것은 deque, Counter, defalutdict를 하나 하나 적어보려 합니다.

deque (연결리스트 기반 구현, 기존 리스트 보다 효율적)

  • from collections import deque 로 모듈 임포트.
  • lst = deque() 를 사용하면 선언됨.
  • lst.append(1), lst.popleft() 으로 큐 처럼 사용 가능.
  • lst.appendleft(1), lst.pop() 으로 양쪽 방향 모두 사용 가능.

Counter (데이터가 몇개인지 새어 딕셔너리 형태로 표기)

from collections import Counter

c = Counter('hello')
print(c) # Counter({'l': 2, 'h': 1, 'e': 1, 'o': 1})

defalutdict (기본적으로 dict 타입이며 정의되지 않은 생성 시 미리 정한 디폴드 값 적용.)

from collections import defaultdict

d = defaultdict(lambda: 0) # Default 값을 0으로 설정합
print(d["first"]) # 0 출력

제너레이터

제너레이터를 알기 전 iterator를 간단히 알아보겠습니다.

iterator란 데이터를 순서대로 출력하기 위해 튜플이나 리스트 등 에서 사용하며 내부적으로 iter와 next 함수를 사용합니다.

cities = ["Seoul", "Busan", "Jeju"] 

iter_obj = iter(cities) 

print(next(iter_obj)) # Seoul
print(next(iter_obj)) # Busan
print(next(iter_obj)) # Jeju

next(iter_obj) # 오류

이런 iterable 객체를 특수한 형태로 사용하는 것이 제너레이터(Generator) 입니다. [] 대신 ()을 사용하여 표현합니다.

gen_ex = (n*n for n in range(500)) # 제너레이터

print(type(gen_ex)) # <class 'generator'> 출력
print(list(gen_ex)) # 원래 리스트 형태로 출력

제너레이터를 사용하게 되면 메모리 용량을 큰 폭으로 아낄 수 있어서 큰 데이터를 다룰 때 주로 사용됩니다.

또 중간 과정에서 loop가 중단 될 수도 있기 때문에 list 타입 데이터를 반환하는 함수는 제너레이터로 만드는 것이 좋습니다.

다음은 함수 내 yield을 사용한 제너레이터 예시 입니다.

def square_numbers(nums):
    for i in nums:
        yield i * i
 
my_nums = square_numbers(([1,2,3,4,5]))
print(my_nums) # <generator object square_numbers at 0x0000018F6AFB7350>
for num in my_nums:
    print(num) # 1, 4, 9, 16, 25

느낀점

적어놓은 것 이외에도 많이 배웠습니다만.. 정말 방대한 분량이기 때문에 최소한 이것만은 알고가자 하는 것만 적었습니다.

가끔씩 내용은 얼핏 생각 나는데 개념이나 정확한 코드가 생각나면 스스로 많이 찾아올 것 같습니다.

들으면서 느끼는 것이 파이썬 개념이 많이 모자랐구나라는 생각과 제 부족한 부분을 잘 채워주는 정말 좋은 강의인 것 같아요.

쓰느라 참 함들었습니다. 꼭 꾸준히 썼으면 좋겠습니다!