분류 전체보기 (52) 썸네일형 리스트형 [패스트캠퍼스 - 30개 프로젝트로 끝내는 추천시스템 구현 강의 Chapter04. 그래프 기반 추천시스템] Homophily : 동종 선호, 그래프 내에서 자신과 유사한 개체들이 서로 연결되는 특성 그래프 데이터의 이해 그래프 데이터란? 모든 관계를 그래프로 나타낼 수 있음. 구조 표현의 유연성/확장성 : 개체 간의 복잡한 관계와 의존성 정보를 자연스럽게 포착함. 어떠한 관계도 노드와 그들의 연결 정보(엣지)가 있다면 그래프로 표현할 수 있음 관계의 활용 : 연결 관계에서 정보를 추출한다는 점에서 기존의 분석 방법으로 찾을 수 없던 패턴을 발견할 수 있음 관련 용어 노드 : 정점 셀프 노드 : 본인의 노드와 연결되어 있는 노드 엣지 : 노드를 연결 인접행렬 : 그래프에서 어느 꼭짓점들이 변으로 연결되었는지 나타내는 정사각 행렬 인접행렬의 특징 정사각행렬 : 인접행렬은 N*N의 정사각형 행렬의 형태를 띔 대칭성.. [패스트캠퍼스 - 30개 프로젝트로 끝내는 추천시스템 구현 강의 Chapter03. 딥러닝 기반 추천시스템] 딥러닝 기반 추천 시스템 CF 기반 딥러닝 모델 NCF (Neural Collaborative Filtering) 선형 모델인 MF 말고 비선형 MLP를 쓰자 GMF(Generalized Matrix Factorization)와 MLP를 결합함으로써 유저-아이템 상호작용의 선형적/비선형적 패턴을 모두 잡아냄. MF 선형 모델로서의 한계점 Implicit Setting : 0이라고 싫다는 것이 아니며, 1이라고 좋다는 의미가 아님 implicit한 matrix가 있을 때 선형 기반인 MF 모델은 표현에 더 큰 제약을 가짐 NCF-MLP로 만들어낸 MF 모델 CF를 뉴럴넷으로 구현 입력의 형태는 유저와 아이템에 대한 one-hot 벡터로 이후 k 차원으로 맵핑하는 레이어를 통과함 binary corss-en.. [패스트캠퍼스 - 30개 프로젝트로 끝내는 추천시스템 구현 강의 Chapter02. 머신러닝 기반 추천시스템] 모델 기반 추천 시스템 1. 트리 기반 모델 트리 모델 DT 주어진 입력 피처에 대해 일련의 결정 규칙을 생성하는 알고리즘 단순한 구조로 다소 부족한 일반화 성능을 가짐 앙상블 모델 목표 : 다수의 모델을 구성해 에러를 줄이는 것 고려할 점 1) 어떻게 충분한 다양성 보장? * 배깅, 피처 random selection 2) 개별 모델을 어떻게 취합? 다수의 모델을 조합해 사용하면 개별적인 알고리즘이 가진 장점을 더하고 단점은 보완 가능 앙상블 종류 1) 배깅 : 다르게 샘플링한 데이터로 각각 다른 모델 학습, 분산을 줄이는 것이 목표 bootsrtap : 원본 데이터셋에서 복원 추출한 데이터셋 aggregation : 각 데이터셋에서 샘플링된 결과를 결합 2) 부스팅 : 모델을 순차적으로 학습시키며, .. [SQLD 1과목 요점정리] 데이터 모델의 이해 모델링의 이해 정의 : 다양한 현상을 표기법에 의해 표기하는 것 특징 추상화 : 일정한 형식에 맞춰 표현 단순화 : 제한된 표기법이나 언어로 표현 명확화 : 이해가 쉽게 표현 3가지 관점 데이터 관점 : 업무와 데이터 사이의 관계 프로세스 관점 : 진행되고 있거나 진행되어야 하는 업무 상관 관점 : 데이터에 대한 업무 처리 방식의 영향 데이터 모델의 기본 개념 이해 정의 : 정보 시스템을 구축하기 위한 데이터 관점의 업무 분석 기법 제공 기능 : 시스템 가시화, 시스템 구조와 행동 명세화, 시스템 구축의 구조화된 틀 제공 : 문서화, 세부 사항은 숨기는 다양한 관점 제공, 상세 수준의 표현방법 제공 데이터 모델링의 중요성 및 유의 중요성 : 파급효과(Leverage), 간결한 표현(C.. [패스트캠퍼스 - 30개 프로젝트로 끝내는 추천시스템 구현 강의 Chapter01. 고전적인 추천시스템] 추천시스템의 정의 유저와 아이템의 주변 정보와 상호작용 기록을 바탕으로 유저가 선호할 아이템을 예측하여 유저의 의사결정을 돕는 인공지능 서비스 유저(user) : 서비스를 이용하는 주체 아이템(item) : 서비스에서 판매/제공하는 대상 물품 상호작용(interaction/log) : 서비스 내에서 유저가 남기는 일련의 행동 기록 (구매 개수, 구매 여부, 클릭 여부) context : 추천이 노출되는 여러 정보 Information Overload : 과도하게 많은 정보에 압도해 판단을 내리기 어려운 현상 FOMO(Fear of Missing Out) -> Filtering으로써의 추천 검색 vs 추천 검색 시스템 추천 시스템 작동 방식 Push Pull Query 입력 있음 없음 작동 시점 사용자 요.. [ADsP 2과목 요점 정리] 2-1. 데이터 분석 기획의 이해 2-1-1. 분석기획 방향성 도출 분석 기획 ? 실제 분석 수행하기에 앞서 과제를 정의하고 의도했던 결과를 도출할 수 있도록 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 분석 대상(What)과 방법(How) Optimization(Known, Known), Insight(Un-known, Known), Solution(Known, Un-known), Discovery(Un-known, Un-known) 분석 기획시 고려사항 - 가용 데이터에 대한 고려, 데이터 확보가 우선적, 유형에 따라 적용 가능한 솔루션 및 분석 방법이 다르기에 유형에 대한 분석이 선행적으로 이루어져야 함. - 가치가 창출될 수 있는 적절한 활용방안과 유즈케이스 탐색 필요 - 장애요소.. [ADsP 1과목 요점 정리] 1-1. 데이터의 이해 데이터의 특성 존재적 특성 : 객관적 사실 당위적 특성 : 추론·예측·전망·추정을 위한 근거 데이터의 유형 구분 형태 차이 예 특징 정성적 데이터 (qualitative data) 언어, 문자 등 비정형 데이터 주관적 내용 통계 분석이 어려움 회사 매출이 증가함 저장, 검색, 분석에 많은 비용 소모됨 정량적 데이터 (quantitative data) 수치, 도형, 기호 등 정형 데이터 객관적 내용 통계 분석이 용이함 나이, 몸무게, 주가 비용 소모가 적음 지식 경영의 핵심 이슈 구분 의미 예 암묵지 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로는 드러나지 않은 지식 김치 담그기 자전거 타기 형식지 문서나 매뉴얼처럼 형상화된 지식 교과서 비디오 DB 암묵지 : 사회적으로 중요하.. [Deep Neural Networks for YouTube Recommendations] " Deep Neural Networks for YouTube Recommendations " - Paul Covingtion, Jay Adams, Emre Sargin (2016) Introduction 유투브는 영상 콘텐츠를 만들고 공유하고 찾는 가장 큰 플랫폼임. 유투브는 계속해서 성장하는 비디오 형태로부터 많은 유저에게 맞춤형 콘텐츠를 추천해야 함. Scale : 방대한 규모와 효율적인 서빙 시스템을 고려한 효율적인 추천 알고리즘을 적용할 수 있는 방법을 찾아야 함. Freshness : 실시간으로 초당 많은 시간의 비디오가 업로드됨. 모델은 새롭게 업로드되는 내용과 그에 대한 유저의 행동을 충분히 다룰 수 있어야 함. Noise : sparsity와 관찰되지 않은 외부 요인의 다양성 때문에 예측.. 이전 1 2 3 4 5 6 7 다음 목록 더보기