• devfest 2023 in songdo

    2023. 12. 10. 16:40

    by. 위지원


    정말 오랜만에 글을 쓰는 것 같다.  마지막 글이 3월이라니?!

    프로젝트 투입 후 너무 바빴고,,(지금도 바쁨이 거의 맥스치다 ㅠㅠ)
    잠깐 내가 지금 진행하는 프로젝트를 간략하게 얘기하자면(나중에 또 끝나고..를 쓸테지만)
    sybase to edb 이행을 하고있다. 정말 죽겠다.
    나는 작년에 impala와 oracle을 번갈아가며 사용해야하는 상황에 놓여있었는데 이번엔 sybase와 postsql을 번갈아가며 사용하고있다.
    sybase는 정말 최악의 db다. 마치 python(oracle) c언어(sybase)라 할까나...?
    다시 만나고싶지 않은 친구다 -_-...플젝 이야기는 나중에 더 자세하게 하고...

    맞아..그리고..건강상 현생에 좀 집중했다.(다이어트로 20키로가량 감량하고 지금은 5키로 복구...하하 😀)

    AWS Summit 2023 이후로 오랜만에 컨퍼런스를 왔다. 송도 진짜 멀다.. 2시간 정도 걸린 것 같다.  그래도 간간히 컨퍼런스를 와야 신기술도 알고 에너지를 얻어갈 수 있어서 좋다. 개 발 조 아

    무튼, 오늘 컨퍼런스에서 얻은 키워드는 다음과 같다.

    - vectorDB
    VectorDB is a lightweight Python package for storing and retrieving text using chunking, embedding, and vector search techniques

    - toast
    PostgreSQL uses a fixed page size (commonly 8 kB), and does not allow tuples to span multiple pages. Therefore, it is not possible to store very large field values directly. To overcome this limitation, large field values are compressed and/or broken up into multiple physical rows. This happens transparently to the user, with only small impact on most of the backend code. The technique is affectionately known as TOAST (or "the best thing since sliced bread").

    - flat file
    A flat-file database is a database stored in a file called a flat file. Records follow a uniform format, and there are no structures for indexing or recognizing relationships between records.

    - 그래프세이지

    Python, Machine & Deep Learning

    Python, Machine Learning & Deep Learning

    greeksharifa.github.io


    - 희소텐서

    희소 텐서란 대부분의 입력 항목이 0인 Dataset입니다. 대형 대각선 행렬(diagonal matrix)이 대표적인 예입니다.

    - 하이퍼 그래프
    대규모 그래프

    - labeled property graph

    A labeled property graph (LPG) is a type of graph database.


    그리고 오늘 내가 들으려했던 세션은 아래와같다.

    - bqml: 빅쿼리 내에 엔진, sql로 머신런닝이 가능하다는게 특징

    - data 자체만 가지고 model에 fit하게 만들 수 있는 여러가지 접근방법에 관한생각들.

    - bucketize: To separate into buckets or groups; to categorize.

    - manual feature processing이 documetation에 추가되는 추세

    - mlops를 왜 해야하는가? , 검증문제. 머신런닝은 결정적이지않다. 머신런닝은 확률 기반,, 입력데이터에 의존적인 결과.

    - ai lakehouse

    Lakehouse AI: A Data-Centric Approach to Building Generative AI Applications

    Generative AI will h

    www.databricks.com

    '2023년' 카테고리의 다른 글

    centOS7 + Superset + Oracle  (0) 2023.03.02
    Python OCR  (3) 2023.03.02
    Superset 설치 메모  (0) 2023.02.07
    Data Mart, Data Warehouse, Data Lake  (6) 2023.01.13
    Oracle Study  (4) 2023.01.11

    대화의 장 💬