티스토리 뷰

Developer

[Conference] Tech Planet 2016

rocksea 2016. 10. 18. 19:12

SK Techplanet 후기.



테크플래닛 2016, 역시나 ML과 Bigdata 분산처리를 이용한 기술이 큰 화두였으며,  각 세션마다 기술적용 도입사례를  소개하는 방식의 프레젠테이션을 통해 각 세션에 대한 요약 및 정리를 해보았다.

1. Large-scale Robust Online Matching with lts applications in Alibaba (Rong Jin / VP, Alibaba Group)
적절한 온라인 상담을 위한 매칭 시스템으로 대규모 온라인 매칭연결을 위해 최적화 이론과 양변 일치 이론을 바탕으로 연구한 결과를 소개하였다. 


요약
- 유저가 원하는 답변을 해줄 수 있는 상담원을 정확하게 매칭해 주는 기술이 핵심.
- Stable marriage model ( https://rosettacode.org/wiki/Stable_marriage_problem )

2. Cognitive Computing with Multilingual Watson(Salim Roukos / Sr. Manager, IBM Watson Fellow)
Watson solution의 도입을 가속화하기 위해 다중 언어를 지원하는 것을 포함하는 클라우드 기반의 인지 서비스의 NLP(Natural Language Processing)에 대한 새로운 통계 모델 개발에 대한 개요를 다룬다 . Watson Developer Cloud에서 사용 가능한 대화(conversation), 자연언어에 대한 이해(Natural Language Understanding), 음성에서 텍스트 전환 (Speech to Text) 및 번역 (Language Translation)등의 다양한 서비스에 대하여 다룬다.

요약
- Multi-Lingual NLP 인지시스템-> Classfication -> Machine Learning을 통해 다양한 언어를 지원하는 대화형 시스템을 만드는것이 핵심기술
-  Watson Cloud : http://www.ibm.com/watson/developercloud/services-catalog.html
- NLP : https://en.wikipedia.org/wiki/Natural_language_processing


3. Echosystem of Python (김영근 / Python SW재단 이사)
파이썬의 성공의 연료인 커뮤니티와 파이썬 생태계에 대해서 설명하고 다양한 파이썬 활용 사례에 대해서 소개한다.
기본적으로 파이선 비기너가 들으면 좋을것 같다라는 생각이 들었으며, 리마인드 차원에서 편하게 들을 수 있었다.




요약
pyc, pypy, jython 등의 다양한 구현체
- OOP, Functional Language의 멀티 패러다임.
Docker Prototype, Disney, Launch Pad Software, Phillips, D-Link, Nasa, 문명5 등에서 활용됨.
Python2 or Python3?  앞으로 Python3만 지원하기때문에 처음시작시 Python3로 시작.


4. Visual Search at SK Planet (나상일 매니저 / SK Planet)
SK Planet에서 연구,개발한 Visual search technology를 소개하며, 특히 11번가 패션상품 검색에 어떻게 적용되었는지,  최신의 Visual recognition / Language modeling 기술을 살펴보고, visual information, textual information을 결합한 대용량 검색모델에 대한 연구 진행사항에 대하여 발표하였다.



요약
- 상품이미지를 통해 -> 카테고리 예측 -> 관심영역 추출 -> 특징 추출
- 카테고리 예측에 Deep Learning 적용하여 Score가 가장 높은 카테고리 선정
- Grab-cut, Saliency, HOG(Histogram of Oriented Gradient) + SVM(Support Vector Machine)을 통한 관심영역 추출에대 검증
- Pattern, Color등에 대한 특징 추출
- 검색서버 성능향상을 위해 Redis를 활용하여 병렬처리
- HOG : https://en.wikipedia.org/wiki/Histogram_of_oriented_gradients
- SVM : https://en.wikipedia.org/wiki/Support_vector_machine

5. Travel Platform (전민수 / Lead Architect)
RDB에서 데이터 동기 및 분산형 검색 시스템을 구축하면서 벤더의 제품에 의존하지 않고 리얼타임으로 데이터 동기화를 구현한 경험을 바탕으로 발표하였다.
(개인적으로 사례를통한 적절한 비유와 PPT로 가장  이해가 쉬웠다. 또한 발표자님의 일본식 한국어 발음이 재미를 더했다.)


요약
- read 25 : write 1의 비율로 I/O발생
- Scalable, Low latency, Trouble shooting, SLA, Fault Tolerance, Cost Efficiency 에대한 고려
- MongoDB, Redis, RabbitMQ를 이용하여 인프라구축  
- Ansible (Provisioning Tool)을 이용한 서버 자동 배포환경 구축


5. In-App Messaging and  Chatbot (김태양 / 팀장, SK Planet)
App 내에 Chat 기능을 사용할 수 있도록 하는 In-App Messaging SDK 개발과 적용 사례에 대해서 알아보고, 2016년 화두가 되고 있는 대화형 커머스(Conversational Commerce)와 Chatbot 에 대하여 발표하였다.


요약
- In-App Messaging 정의 : Mobile App 내에 실시간 메세지 전송기능을 제공
- Conversational Commerce 정의 : Chat Interface를 통해 브랜드, 상거래등의 기능을 제공
- 챗봇 정의 : 대화형 UI에서 동작, 사전 정의된 Interface, 자연어를 통해 Context에 맞는 응답을 제공하는 커뮤니케이션 소프트웨어
- 챗봇의 발전 방향 :  자연어 -> ML을 이용한 AI
- Node.js, Websocket, Long Polling, JWT를 이용하여 어플리케이션 구현


6. Google Tensor Flow & Machine Learning in the Cloud (Kaz Sato / Evangelist, Google Japan)
뉴럴네트워크가 무엇인지, 딥러닝은 왜 중요한지 이러한 기술들을 제품서비스에 적용하는데 난관들은 없는지, 이러한 질문에 대한 답변을 제시하고 구글이 어떻게 성공적으로 거대규모의 뉴럴네트워크를 구글포토, 안드로이드, 구글서치 등에 적용했는지  또한 새로운 구글비젼API, 스피치 API, 텐서플로우, 클라우드Ml등의 새로운 구글클라우드 제품들을 소개하고 이들이 어떻게 개발자들로 하여금 구글의 머신러닝 경쟁력을 확장 가능하고 통제가능한 서비스들에  대하여 발표하였다.


요약
-
Input "Cat Image" -> Ventor -> Algebra Function -> Other Vector -> "Cat"
- Hidden Layer가 많아질수록 더 스마트한 결과 도출
- Cloud ML ( Vision-explorer.reactive.ai ), TensorFlow등을 이용하면 손쉽게 ML 구현가능
- Portable and Scalable
- GPU를 활용하여 성능향상
- Image, 시계열데이터 분석가능
 유즈케이스 : 오이분류기, 치킨너겟 서빙머신, 드론을 활용한 일반개인개발자들도 간단하게 도입
- Datacenter & Jupiter Network ( 10GbE x 100 K = 1Pbps )
- TPU Tensor Process Unit (CPU, GPU보다 가성비가 훌륭하다)


7. 빅데이터와 자연어처리 기술을 이용한 11번가 상품추천 (황영숙/팀장, SK Planet)
SK플래닛에서의 자연어처리와 텍스트 마이닝 기술을 간단히 소개하고, 11번가 서비스에서 생성/수집되는 방대한양의 상품데이터와 사용자 행동정보를 빅데이터 처리와 자연어처리 기술을 결합하여 분석, 상품과 사용자를 공통의 의미 속성 공간에서 모델링하고, 이를 상품 추
천, 마케팅 및 컨시어지 서비스 기술 개발 등에 활용하는 현황에 대해 발표하였다.


요약
-
팔레토 법칙(상위 20%가 전체매출을 차지) VS 롱테일법칙(하위 80%가 전체매출을 차지)
- 협업필터링(Collaborative Filtering) : 고객 행동이력을 기반으로 고객소비패턴 분석 하여 추천 제공
- 상품기반필터링(Content-Based Filtering) : 상품의 정보분석 정보를 기반으로 추천
- 자연어 처리(NLP), 머신러닝(ML)기반의 추천시스템 구성

8. Facebook Chatbot M messenger (Alex Lebrun/Team Lead, Facebook)
요즘 봇들이 최고의 관심을 받고 있다. 따라서 인공지능과 봇의 역사를 간략하게 짚어보고 개발자들이 봇을 만들어 활용 할 수 있는 베스트프랙티스(best-practice)에 대한 발표를 진행하였다.

요약
- 앨런튜링에 의해 AI가 화두가됨.
- 지난 20년간 AI에 대한 연구가 없었으며, 최근 등장한 Deep learning 이후 ML에대한 연구가 활발해짐
- Chatbot  : NLP -> ML -> Answer
- Chatbot도 ML에의한 기술의 한계가 있기때문에 때때로 사람의 컨트롤이 필요함.
- Wit.ai에서 자연어처리에 대한 데모가능


참고 사이트 
https://nhnent.dooray.com/share/posts/iegR3nOSSdi-k-BNNvsCPA

'Developer' 카테고리의 다른 글

How to install Couchbase on OSX  (0) 2017.05.02
xcode에서 vim사용하기  (0) 2016.12.07
LRU Cache Algorithm  (0) 2016.10.13
[Jenkins] how to install jenkins on docker  (0) 2016.08.04
How to make shorten url using BASE62  (0) 2016.05.19
댓글