데이터를 사랑하고 궁금해하는 기록쟁이입니다! 😉 Super Data Engineer가 되는 그날까지🏃♀️ 화이팅!
공지
블로그가 아닌 다른 위지원의 활동도 지켜봐주세요~! 👼💌 메일 할 말이 있으신가요? 저에게 메일을 보내주세요! 잡담도 환영합니다 :)👩💻 포트폴리오 제가 지금까지 어떤 개발 생활을 해왔을까요? 알아보고 싶다면 클릭! 🖥깃블로그깃블로그에도 조금 글을 썼었답니다 :) 🎃내맘대로 스크랩읽고 그대로 잊어버리기엔 아까워요. 읽었던 글들을 링크로 기록하고 한 줄 요약을 해놨어요! 🐙 깃허브 보통 블로그에 작성하다보니 별건 없지만 그래도 깃허브를 가지고있습니다 :0!!🌍 위키원 위키디피아 위지원버전! 흥미롭죠? 한번 구경해보세요~
2022.03.16 14:05
2023년
Python OCR 광학 문자 인식(OCR) 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정입니다. 예를 들어 양식 또는 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지 파일로 저장합니다. 이미지 파일에서는 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를 계산할 수 없습니다. 그러나 OCR을 사용하면 이미지를 텍스트 문서로 변환하여 내용을 텍스트 데이터로 저장할 수 있습니다. 출처: AWS 테서랙트(Tesseract) 다양한 운영 체제를 위한 광학 문자 인식 엔진이다.이 소프트웨어는 Apache License, 버전 2.0에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후원했다. 2006년 테서랙트는 당시 가장 정확한 오픈 소스 OCR 엔진 중 ..
2023.03.02 18:23
Developement
나는 노션을 사랑한다... 노션없인 이제 업무도 불가할정도로 :0.. 코테를 다시 공부하려하는데 어떻게 정리할까 하다가 노션에 위키처럼 정리해볼까 한다. ( 깃허브 블로그 불편해서 못ㅆ ) 우선은 기본적으로만 작성하고 추후에 추가하지않을까 하는.. ^^;; 힘내자.. 코테.. 알고리즘 공부 A new tool for teams & individuals that blends everyday work apps into one. weejw.notion.site 추가적인.. 잡설.. 사실 정말 깃헙 블로그 어렵다.. 어렵기보단 번거롭다. 이미 티스토리에 적응되어버린 나는,, 게다가 md에 익숙하지 않은 나는 깃헙액션의 빌드 failed를 무수히 보게되었고, 내 생각대로 모양이 잡혀있지않았고.. 그 때마다 또 왜..
2022.02.10 16:42
21.下
얼마전 블프 때 스팀 게임을 대량으로 구매했다.. (하지는 못했다.. 게임을 사는 것도 게임이다..ㅠ;) 그러던 와중에 내가 스팀게임을 추천받는걸 만들어보면 어떨까? 라는 생각을 했다. 개인인 내가 얻을 수 있는 데이터 양이 한계가 있으므로 스팀 추천시스템보단 열악하겠지만 굉장히 재미있을 것 같아서 시작해보려 한다 :) 우선 블로그에 글을 마구잡이로 작성한 뒤 성공하면 다시 정리하려한다! 계획 그냥 문득 아래처럼 끄적였다. 고민할게 많았다. 1. 일단 얻을 수 있는 모든 데이터를 얻어야한다! steam api, scraping을 찾아내자. 2. 데이터를 어디다가 저장할 것인가? => 데이터의 양을 보고 결정하자 3. 모델은 어떤걸 선택할 것인가? (모델을 하나만 쓸 것인가?) => 데이터의 형태를 보고 ..
2021.12.08 09:01
Development
index()는 한 개만 찾아준다. 고로 여러개를 반환하고 싶을 땐, lis=[1,0,1] #filter 사용 list(filter(lambda e:lis[e] == 1, range(len(lis)))) [0, 2] #enumerate 사용 [i for i, ele in enumerate(lis) if ele == 1] [0, 2]
2020.06.10 10:56