분류 전체보기
-
MapReduceMACHINE LEARNING 2019. 6. 11. 07:38
이 글은 WorDS 에 올라온 글을 번역한 것입니다. 저자에게 번역에 대한 허가를 받지 않았기에, 언제든 삭제 될 수 있습니다. 오역이 있을 수 있으니, 가능하면 원글을 읽는 것이 좋습니다. Map-Reduce는 분산된 데이터 처리를 단순화하는 확장 가능한 프로그래밍 모델입니다. Map-Reduce는 Mapping, Shuffling 및 Reducing의 세 가지 주요 단계로 구성됩니다. Map-Reduce 작업을 쉽게 할 수 있는 방법은 대규모 작업을 여러 사람에게 '위임'한 다음 각 작업 결과를 결합하여 최종 결과를 산출하는 것입니다. 포인트를 가져 오는 예를 들어 봅시다. 방금 이 위대한 소식을 사무실에서 들었고 모든 동료를 위해 파티를 열었습니다! 저녁 식사를 위해 파스타 요리를 하기로 결정했습니..
-
데이터 과학의 5가지 PMACHINE LEARNING 2019. 5. 31. 07:05
이 글은 WorDS 에 올라온 글을 번역한 것입니다. 저자에게 번역에 대한 허가를 받지 않았기에, 언제든 삭제 될 수 있습니다. 오역이 있을 수 있으니, 가능하면 원글을 읽는 것이 좋습니다. 데이터 과학은 데이터에서 지식을 추출하는 것에 관한 것입니다. WorDS 센터에서는 데이터 과학을 사람, 프로세스, 계산 및 빅 데이터 플랫폼, 특정 목적 및 프로그래밍 가능성을 결합한 다방면의 기술로 정의합니다. 이러한 간행물로 이어지는 데이터 제품의 간행물 및 출처는 데이터 과학에서도 중요합니다. 사람(People) : 데이터 과학자는 과학 또는 비즈니스 영역 지식을 비롯하여 다양한 주제에 대한 기술을 보유한 사람들로 종종 간주됩니다. 통계, 기계 학습 및 수학 지식을 사용한 분석; 데이터 관리, 프로그래밍 및 ..
-
빅 데이터MACHINE LEARNING 2019. 5. 29. 07:32
이 글은 WOrDS 에 올라온 글을 번역한 것입니다. 저자에게 번역에 대한 허가를 받지 않았기에, 언제든 삭제 될 수 있습니다. 오역이 있을 수 있으니, 가능하면 원글을 읽는 것이 좋습니다. 요즘 '빅 데이터'라는 용어가 모든 곳에서 보여집니다. '빅 데이터'는 전통적인 데이터베이스 시스템을 사용하여 관리하기 어려운 데이터 세트를 지칭하기 위해 사용됩니다. 또한, 단일 서버에서 처리하기에는 너무 큰 데이터 모음에 대해서 포괄적인 용어로도 사용됩니다. 어떤 사람들은 이 용어를 단순히 "많은 데이터"를 의미하는 것으로 사용합니다. 그렇다면 빅 데이터는 정확히 무엇입니까? '빅'의 정확한 사양은 파악하기 어렵습니다. 한 조직에서 큰 것으로 간주되는 것이 다른 조직에서는 작을 수 있습니다. 현재 대규모의 데이터..
-
빅 데이터 : 혁신, 경쟁 및 생산성을 위한 개척자MACHINE LEARNING 2019. 5. 21. 07:49
코세라의 빅데이터 스페셜코스 수강중 제공받은 보충자료를 추후에도 볼 수 있게 번역한 글입니다. 원문 저자에게 번역과 관련하여 승인 받지 않아, 추후 삭제 될 수 있습니다. 오역이 있을 가능성이 매우 높으니 가능한 원문을 읽기 바랍니다. 원문링크 : https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation 빅 데이터는 경쟁 정책의 핵심 기반이 될 것이며, 올바른 정책과 실현 요인이있는 한 생산성 증가, 혁신 및 소비자 잉여의 새로운 흐름을 뒷받침합니다. MGI의 연구에 따르면 우리 세계의 데이터 양이 폭발적으로 증가하고 있으며, 소위 빅 데이터 (big da..
-
'Make JAR, not WAR.' - Josh LongJAVA 2019. 4. 18. 10:53
Satyajit Nalavade 가 쓴 블로그를 번역한 내용입니다. 오역이 있을 수 있으니, 원본을 보시기 바랍니다. 실행 가능한 JAR는 자체적으로 실행 가능한 응용 프로그램을 패키지화하는 편리한 방법입니다. 이렇게 하면 종속성을 최소화할 수 있습니다. 클라우드 환경에 친화적이고 편리합니다. (자신의 컨테이너를 가져오세요). 여러 어플리케이션에 의해 어플리케이션 서버를 공유하는 것은, 여러 어플리케이션을 WAR로 포장하는 이유 중 하나였습니다. 스프링 부트는 메이븐 과 그레들로 빌드 됩니다. 애플리케이션 실행에 필요한 모든것을 버전관리 할 수 있습니다. 쉬운 확장이 가능 합니다. 다른 서버에서 인스턴스를 복사해서 실행만 하면 됩니다. TomEE, Wildfly. Websphere 등의 컨테이너를 위한 ..
-
T머니 데이터 공개를 보면서 느끼는 소회...ANYTHING 2019. 4. 11. 11:22
예전에 SKT 의 서비스중 하나였던 Tcash 백엔드 개발을 할때 였다... 이번에 공개되는 정보를 당시에 볼 수 있었기에... 분석해서 리포트를 제공하는 서비스를 제안했었다. 당시 답변은 SKT 의 허가가 필요하다... SKT 는 T머니와 협의된 부분이 아니라서 안된다 였다.... 늦었지만... 지금이라도 분석해 볼까??? 아... 귀찮은데... ㅎㅎ http://www.bloter.net/archives/336484?fbclid=IwAR35N4cPOw3eIIMMsreUijbBnLkcDaxhcQiUANo58CN17cc0H-A75qwe5Gw
-
빅데이터와 오늘날 비즈니스 모델의 창조적 파괴MACHINE LEARNING 2019. 4. 5. 13:35
코세라의 빅데이터 스페셜코스 수강중 제공 받은 문서를 학습하기 위해 번역한 내용입니다. 원본은 아래 첨부파일을 확인하시면 됩니다. 빅데이터는 기존 기술로는 처리하기가 사실상 불가능한 엄청나게 큰 데이터 세트로, 이를 활용하는 법을 배우는 기업들에게 큰 이점을 제공한다. 유명한 20세기 경제학자 조지프 슘페터(Joseph Schumpeter)는 “혁신은 그들의 본성 덕분에 큰 발전과 큰 변화를 암시한다 ... 그 이후에는 그전에 최적이었던 ‘일을 하는 방법’은 거의 남아 있지 않게 된다.”고 말했다. 슘페터의 말은 빅데이터가 오늘날의 비즈니스 모델을 창조적으로 파괴할 가능성이 있다는 것을 보여준다. 세상은 매일 매 순간 데이터가 넘쳐나고, 속도가 느려지지 않는다. 2012년에만 2.5제타바이트(1 제타 바..