python

python3 container

huggingface나 코테에서 활용되는 python built-in container들을 정리했다. collections UserDict Docs 일반적인 python의 dictionary와 동일하다. 상속받거나 객체로써 다루기 쉽도록 만든 단순한 wrapper다. HuggingFace BatchEncoding Github HuggingFace의 tokenizer를 호출하면 BatchEncoding type으로 return해준다. BatchEncoding을 아래와 같이 pop하는 코드들이 있었는데 이해가 가지 않았다. 찾아보니 BatchEncoding은 UserDict의 subclass였다. 즉, python dictionary에서 쓰는 pop의 기능을 그대로
Sungho Park

[백준] 2048 (Easy)

ref blog 문제 우리가 흔히 아는 그 게임이다. 다만 제약조건이 추가된다. * 한 번의 이동에서 이미 합쳐진 블록은 다시 못 합침 * 3개 이상의 블럭이 합쳐질 수 있다면, 이동하는 방향에 가장 가까운 것들부터 합친다. * e.g., 위로 이동하는거면 위에 것들부터 풀이 합치는 아이디어 자체는 쉽게 도출 가능하다. 비어있으면 값을 옮기고, 값이 같으면
Sungho Park

pandas

쓸 때마다 쓰기 싫고 사용법 익히자마자 잊어버리는 pandas다. 까먹지 않게 정리해둔다. Pandas tabular 데이터를 다루기 위한 라이브러리. R의 체계를 많이 따왔다고 한다. numpy와 통합되면서 성능도 향상됐다고 한다. DataFrame * Data table 전체를 포함하는 object. 모든 데이터의 wrapper라고 생각하면 된다. * DataFrame의 Serires들은 Series마다 data type이 다를 수 있다. Series ojb = Series(data=
Sungho Park

pytorch template, tip

Template 지금까지 졸업프로젝트, 회사 인턴이나 알바들을 할 때 tf도 쓰고 pytroch도 썻지만 template이란 것들 정해두고 쓰지 않았다. 중구난방하게 필요에 따라서 디렉터리와 스크립트를 추가하고 분리하고 구현하고... 물론 템플릿이 만능은 아니다. 어느 템플릿이 그렇듯 흥망성쇠를 하겠지만 그래도 형식이란 것을 갖추고 개발을 시작하는 것만큼 효율적인 것은 없다고 생각한다. https://github.com/victoresque/pytorch-template
Sungho Park