빅데이터
-
ClickHouse 개요 및 활용법ANYTHING 2025. 3. 5. 20:21
ClickHouse란?ClickHouse는 고성능 컬럼형(columnar) 데이터베이스로, 빠른 데이터 분석을 위해 설계된 오픈소스 DBMS(Database Management System)다. Yandex에서 개발했으며, 대규모 로그 분석, BI(Business Intelligence), 실시간 데이터 분석 등에 최적화되어 있다.1. ClickHouse의 주요 특징🚀 1) 빠른 데이터 처리 속도컬럼 기반 저장(Columnar Storage)일반적인 행 기반(row-based) DBMS보다 분석 쿼리에 최적화됨.필요한 컬럼만 읽기 때문에 입출력 비용(IO) 감소.벡터 연산(Vectorized Execution)SIMD(단일 명령어 다중 데이터) 방식으로 연산을 병렬 처리하여 성능 향상.압축(Compre..
-
대용량 데이터의 저장 : 빅데이터 및 필요한 저장 장치의 유형 정의MACHINE LEARNING 2019. 7. 22. 07:14
이 글은 ComputerWeekly 에 올라온 글을 번역한 것입니다. 저자에게 번역에 대한 허가를 받지 않았기에, 언제든 삭제 될 수 있습니다. 오역이 있을 수 있으니, 가능하면 원글을 읽는 것이 좋습니다. 대용량 데이터의 저장 : 대용량 데이터 분석을 사용하는 컴퓨팅 / 스토리지 시스템 구성 요소의 종류는 무엇입니까? 지난 1~2 년 동안 비즈니스 IT에서 빅데이터가 핵심 단어로 떠올랐습니다. 서플라이어가 마케팅 자료로 빅데이터를 다양하게 활용하려고 하기 때문에 쉽게 시니컬해질수 있습니다. 빅데이터 란 무엇입니까? 빅데이터 현상에 대한 가장 단순한 설명은 한편으로는 다량의 데이터에 관한 것이고 다른 한편으로는 대용량 데이터 세트에 대한 분석 입니다. 표면적으로는 데이터의 양이나 분석 요소 중 어느 것도..
-
빅 데이터MACHINE LEARNING 2019. 5. 29. 07:32
이 글은 WOrDS 에 올라온 글을 번역한 것입니다. 저자에게 번역에 대한 허가를 받지 않았기에, 언제든 삭제 될 수 있습니다. 오역이 있을 수 있으니, 가능하면 원글을 읽는 것이 좋습니다. 요즘 '빅 데이터'라는 용어가 모든 곳에서 보여집니다. '빅 데이터'는 전통적인 데이터베이스 시스템을 사용하여 관리하기 어려운 데이터 세트를 지칭하기 위해 사용됩니다. 또한, 단일 서버에서 처리하기에는 너무 큰 데이터 모음에 대해서 포괄적인 용어로도 사용됩니다. 어떤 사람들은 이 용어를 단순히 "많은 데이터"를 의미하는 것으로 사용합니다. 그렇다면 빅 데이터는 정확히 무엇입니까? '빅'의 정확한 사양은 파악하기 어렵습니다. 한 조직에서 큰 것으로 간주되는 것이 다른 조직에서는 작을 수 있습니다. 현재 대규모의 데이터..
-
빅 데이터 : 혁신, 경쟁 및 생산성을 위한 개척자MACHINE LEARNING 2019. 5. 21. 07:49
코세라의 빅데이터 스페셜코스 수강중 제공받은 보충자료를 추후에도 볼 수 있게 번역한 글입니다. 원문 저자에게 번역과 관련하여 승인 받지 않아, 추후 삭제 될 수 있습니다. 오역이 있을 가능성이 매우 높으니 가능한 원문을 읽기 바랍니다. 원문링크 : https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation 빅 데이터는 경쟁 정책의 핵심 기반이 될 것이며, 올바른 정책과 실현 요인이있는 한 생산성 증가, 혁신 및 소비자 잉여의 새로운 흐름을 뒷받침합니다. MGI의 연구에 따르면 우리 세계의 데이터 양이 폭발적으로 증가하고 있으며, 소위 빅 데이터 (big da..
-
[칼럼]여기어때가 4차산업혁명 인재확보에 나서는 이유는?NEWS SUMMARY 2017. 11. 3. 06:29
* 특히 인공지능(AI), 빅데이터, IoT, 클라우드 등 4차 산업혁명을 몰고 올 신기술의 파고에 직면한 상황에서 신기술을 받아들이고, 산업에 적용하기 위해 고도로 숙련된 인재가 절실하다* 신기술을 다룰 줄 아는 사람을 구하기 어렵다는 것이다* AI, 빅데이터, 클라우드 등 4차 산업혁명 핵심으로 불리는 기술을 주도하고, 활용 가능 인재를 대폭 양성하고, 시장에 투입하는 것이다 원문보기 : http://www.lawissue.co.kr/view.php?ud=20171102111031819204ead0791_12
-
포스코, 취업준비생 지원 AI·빅데이터·IoT 무료교육 첫 수료생 배출NEWS SUMMARY 2017. 11. 3. 06:22
* 포스코는 지난 7월 시작한 `취업준비생 대상 인공지능(AI)·빅데이터·사물인터넷(IoT) 인재양성 무료교육`의 첫 번째 수료생을 배출했다고 2일 밝혔다* 앞서 포스코는 포스텍과 함께 취업준비생들의 취업을 돕기 위한 무료교육을 지난 7월 기획하고 온·오프라인에서 각각 2개월씩 운영하기로 한 바 있다* 교육 수료생들으 앞으로 취업·학업을 이어가는 데 있어서도 포스코의 지원을 계속 받을 예정이다 원문보기 : http://vip.mk.co.kr/news/view/21/20/1546871.html
-
(미래를 추적하는 빅데이터)"수집과 관리가 양대 축…거버넌스는 필수"NEWS SUMMARY 2017. 9. 29. 14:38
* 임용재 한국연구재단 정보·융합기술 단장은 ▲활용 가능한 양질의 데이터 확보 ▲빅데이터 산업 활성화를 위한 플랫폼의 뒷받침 ▲전문인력 양성 등을 빅데이터 경쟁력 강화 요건으로 꼽았다 * 빅데이터 경쟁력 강화를 위해서는 양질의 데이터 수집과 품질 관리, 양 날개가 맞아떨어져야 한다 * 빅데이터 전문가로서 과학기술정보통신부 정부정보화사업 전문위원으로도 활동하고 있는 조완섭 충북대 경영정보학과 교수는 "빅데이터는 단순히 '빅'(큰)한 데이터를 모으는 데 그치는 게 아니라 데이터에 대한 체계적 관리(데이터 거버넌스)가 필수"라고 강조했다 * 조 교수는 "국내에서는 빅데이터 수집과 돈 버는 데만 관심"이라며 "이를 관리하고 데이터 오류에 대한 리스크를 줄이는 거버넌스에 대해서는 정작 무관심하다"고 꼬집었다 * ..
-
카카오모빌리티 빅데이터 공개..출근 시 피해야할 곳은?NEWS SUMMARY 2017. 9. 26. 16:51
* 카카오 관계자는 “2014년 통계청 자료에 따르면 한국인 하루 평균 이동시간이 1시간 48분 중 가장 높은 비중을 차지하는 게 출퇴근 시간”이라면서 “카카오내비 빅데이터 분석을 통해 출퇴근시 가장 혼잡한 구간을 선정해 공개하게 됐다”고 설명했다 * 카카오내비와 카카오택시 빅데이터로 시간대별 평균 이동속도를 분석한 결과 출근 시간인 9시경에는 택시와 자가용 이동 속도 차이가 거의 없었다 원문보기 : http://media.daum.net/v/20170926145204163