[결과물]




[코드]

> install.packages("shiny") ## 패키지 설치

library(shiny)

runExample()

Valid examples are "01_hello", "02_text", "03_reactivity", "04_mpg", "05_sliders", "06_tabsets", "07_widgets", "08_html", "09_upload", "10_download", "11_timer"

runExample("01_hello") ## 위의 가능한 




[레퍼런스]

http://1004jonghee.tistory.com/entry/%EC%83%A4%EC%9D%B4%EB%8B%88Shiny-%ED%8C%A8%ED%82%A4%EC%A7%80

반응형
Posted by JoeSung
,




[코드]


Sys.setlocale("LC_ALL","ko_KR.UTF-8")



-맥의 경우 UTF-8로 설정을 해도 한글이 종종 깨집니다.

-이유는 mac이 locale 설정이 기본적으로 안되어 있는 경우가 종종 있어서 그렇습니다.

-이런 경우 위의 코드로 locale설정을 바꾸어주면 R studio에서 깨지는 일이 사라집니다.

반응형
Posted by JoeSung
,


-Data 시각화 공부와 정리




[결과물]


[사용 데이터 예시]





[사용 코드]


library(ggmap)

## ggmap이 버전이슈가 최근에 있어서 오류가 날지도 모른다.

## 그런 경우 install.packages("ggmap", type = "source") 를 통해 다시 설치하면 해결.

library(ggplot2)


a <- read.csv(file = "rarara.csv", sep = "," , header = TRUE)

## 파일을 불러오기


sub_a <- subset(a, rain > 50, select = c("longti","latti","rain"))

## 위도와 경도만 가져와서 subset을 만듭니다.

str(sub_a)


cent <- c(lon = 127.8, lat = 35.8)

## 한국(남한)기준 위도 경도의 중심입니다.


map <- ggmap(get_googlemap(center = cent, zoom = 7, maptype='roadmap', color = 'bw'), extent = 'device')

## map 변수에 구글 지도(남한) 부분을 저장합니다.

map + geom_point(data=sub_a, aes(x=longti, y=latti),colour ='gray10', alpha = 1) ## 점을 찍어주는 라인




[레퍼런스]

전국댐위치.xlsx



::비주얼라이즈님의 블로그

http://visualize.tistory.com/111


::Lovetoken님의 블로그

https://lovetoken.github.io/r/data_visualization/2016/10/18/ggmap.html

반응형
Posted by JoeSung
,



## File Structure

크게 3가지의 종류가 있다.

-None : 단어들의 나열이 보통 이런 형식. like ".txt" 파일

-Simple record structure  : 

  *Lines >> 파일 안을 보면 매 라인들을 레코드라고 할 수 있습니다. 10줄을 record structure라고 할 수 있음

  *Fixed length record >>  (고정된 길이의 레코드)

  *Variable length record 등이 있다. 

-Complex Structures

 * Formated document (ex ; html )

 * Reloctable load file (ex; object file )


##Access Methods
-> 파일에 접근하는 방식이 2가지가 있다.
 1] Sequential Access
 2] Direct Access
** 리눅스에서는 다양한 파일시스템들이 커널안에 들어가있습니다.


## Directory Structure
 
My document >> foo.txt >> 이것의 물리적인 주소값을, FCB에서 포인팅할 수 있도록 해요.
My document >> data.txt >>  동일.


## tree structured 16p
path name 윈도우는 역슬래시, 리눅스는 조금 다른 시스템.
absolute // relative 루트디렉토리부터 시작하냐, 지금있는 디렉토리부터 시작하냐에 따라 달라짐.
Ex] 
/workspace/proj/proj1/ver1/hello.c
/workspace/proj/proj1/ver2/hello.c
/workspace/proj/proj1/ver3/hello.c

/workspace/proj/proj1/vi/workspace/proj/proj1 … 와 같은 것은 절대경로라고 할 수 있고
./proj … 이런식으로 나간다면 상대경로이다.

## Acyclic-Graph Directories
-바로가기에 사용되는 기능이다. 내 파일이 다른 디렉토리에서 포인터를 둠으로써, 다른 곳에서 실행을 할 수 있도록 한다.
-문제가 생길 여지 : 본래 파일을 없애버리면, dangling pointer가 발생할 수도 있다.
-Soft/hard line 생략

## General Graph Directory (18p)
-부모디렉토리가 자식 디렉토리를 가리키는 경우에는 끝나지 않는 경우가 생길 수도 있다. (Self-reference)


반응형
Posted by JoeSung
,



https://brunch.co.kr/@datasciencedude/1



반응형
Posted by JoeSung
,



https://gist.github.com/JoeUnsung/88e92eab5d40a5057f421b2da89b50be

반응형

'모조리 Data' 카테고리의 다른 글

운영체제_파일 시스템 정리  (0) 2017.05.31
2.24_데이터 사이언티스트의 분류  (0) 2017.02.24
7.31  (0) 2015.07.31
[입문] How to actually learn data science  (0) 2015.07.29
The best books for every data scientist  (0) 2015.06.23
Posted by JoeSung
,

7.31

모조리 Data 2015. 7. 31. 09:29
http://m.itdaily.kr/news/articleView.html?idxno=64170

애플 시니어 데이터 분석가
권재명 박사님
반응형
Posted by JoeSung
,


 <데이터과학에 대해 제대로 배우는 방법>  How to actually learn data science


<원문>https://www.dataquest.io/blog/how-to-actually-learn-data-science/?utm_content=buffer5a5db&utm_medium=social&utm_source=facebook.com&utm_campaign=buffer


<헬로 데이터 과학> 에서 소개한 요약에 본문의 텍스트를 조금 추가하여 내용을 소개합니다. 의역이 있으니 본문을 읽어보시는 것을 권합니다.


How to actually learn data science.


지금은 데이터과학의 적기다. 이 분야는 새로우며 매우 빠르게 성장하고 있고, 데이터 과학자에 대한 수요는 아주 크다. 이러한 수요와 공급의 차이는 사람들이 데이터과학을 배워야할 이유가 된다. 데이터과학을 배우는 첫번째 단계로 사람들은 이러한 질문을 한다. "데이터 과학을 배우려면 어떻게 해야하죠" 라고. 이러한 질문은 상당히 많은 이수해야 할 여러가지 코스와 읽어야 할 도서목록으로 이어지며, 선형대수와 통계에 대해서도 배울 것을 권한다. 나는 이러한 것들을 혼자 익혔으며 프로그래밍에 대한 경험도 전혀 없었다. 단지 나는 내가 데이터와 함께 일하는 것을 좋아한다는 것을 알았다. 


어떤 맥락적 고려없이 그저 방대한 양의 배워야할 목록이 주어지는 것은 전혀 동기부여되지 않는 일이다. 어떤 사람들은 책으로부터 배우는 것이 최선일지 모른다. 하지만 나는 아니다. 나는 뭔가를 시도함으로서 배우는 것이 최선이었고, 내가 동기부여되었을 때, 그리고 내가 왜 이것을 익혀야 하는지 알고 있을 때야말로 제대로 배울 수 있었다. 당신이 데이터과학에 대해 배우고 싶다면 선형대수나 통계를 익히는 것이 첫걸음이 아니라 데이터를 좋아하고 그걸 위한 방법을 찾아내는 것이 우선이 되어야 한다.



1. Learn to love data

동기부여에 대해 이야기하는 사람은 아무도 없다. 데이터과학은 배우기가 매우 어려운 분야다. 그렇기 때문에 동기부여 없이는 정말로 고된 시간이 될 것이다. 밤을 새는것도 별거 아닐 정도로 강한 동기부여가 되어야 한다. 반드시 필요하다고 생각되는 어려운 것을 배워야 할 때도 동기부여는 매우 중요하다.


2. Learn by doing

뉴럴네트워크, 이미지인식, 커팅엣지테크닉 등은 매우 중요하지만 데이터과학을 행하는 대부분의 시간에서 이것들은 쓰이지 않을수도 있다. 당신의 작업중 무려 90%가 데이터를 정제하는 데 쓰인다. 몇몇 알고리듬에 대해 잘 알고 있는 것이 많은 알고리듬에 대해 얕게 아는 것보다 낫다. 가장 중요한 건 실제 프로젝트를 통해 배우는 것이다. 그것을 통해 실제로 필요하고 유용한 스킬을 익힐 수 있고 포트폴리오도 만들 수 있다. 실제의 경험을 통해 컨텍스트를 얻는 것이 매우 중요하다.


3Learn to communicate insights

데이터과학자는 자신의 분석결과를 다른 사람에게 보여줘야 한다. 이걸 잘할 수 있느냐에 따라 단순한 데이터과학자와 위대한 데이터과학자가 구분된다. 인사이트를 커뮤니케이션하는 것은 우선 주제와 관련 이론을 잘 이해하고, 깔끔하게 결과를 구성하며, 분석결과를 명확하게 설명할 수 있어야 함을 의미한다. 복잡한 컨셉을 효과적으로 설명하는 건 매우 어렵지만, 아래의 몇가지를 통해 도움을 받을 수 있다.

   - 기술적 숙련도가 적은 이들이나 가족들에게 데이터과학의 컨셉에 대해 설명해보라

   - Quora, DataTau, mamachine learning subreddit 등의 커뮤니티에서 활동해보라

   - 블로그를 만들고, 데이터분석결과를 포스팅해라

   - 정기모임에서 발표해보라

   - github 를 활용하라

   

4Learn from peers

다른 이와 일하면서 성장하는 건 매우 환상적인 일이다. 데이터과학의 잡세팅에서 팀웍은 매우 중요하다. 이걸 도울 수 있는 몇가지 아이디어를 소개한다.

   - 데이터과학 블로그를 함께 공동운영할 수 있는 사람들에게 메세지를 보내보라

   - 동료를 찾을 수 있다면, 케글이나 머신러닝 컴피티션에 도전해보라

   - 밋업에서 함께 일할 사람들을 찾아보라

   - 오픈소스 커뮤니티에 기여해보라


5. Constantly increase the degree of difficulty

데이터과학을 하는 건 가파른 산을 오르는 것과 같다. 등반을 멈춘다면 다시는 아무것도 할 수 없다. 지금 하고 있는 프로젝트가 익숙해졌거나 새로운 컨셉을 도출한 것이 오래되었다면, 이제 좀 더 난이도를 높여야할 시기다. 이를 도울 수 있는 몇가지 아이디어다.

   - 알고리듬의 다중프로세서에서도 작동하려면 어떻게 해야 하는가. 그걸 해낼 수 있는가

   - 더 큰 데이터세트로 작업해보라. 그리고 스파크를 배워라

   - 기존의 알고리듬을 더 빠르게 만들 수 있는지 확인해보라

   - 지금 하고 있는 일을 초보자에게 가르쳐보라


결론

여기 제시된 것은 데이터과학을 배우기위해 따라야할 대략적인 가이드의 일부분이다. 이걸 잘해낼 수 있다면 자연스럽게 데이터과학에서의 전문성을 잘 개발하고 있는 자신을 보게 될 것이다. 난 방대한 리스트를 주는 방식을 좋아하지 않는다. 그건 배움의 다음 단계로 진입하는 것을 어렵게 만든다. 많은 사람들이 교과서의 무크의 방대한 양에 질려 배우기를 포기한다 나는 올바른 마음으로 접근한다면 누구든지 데이터과학을 배울 수 있다고 생각한다.



아래는 데이터과학을 공부하는 데 도움이 될만한 리스트업.


출처 : http://keyassist.tistory.com/m/post/263 [지식을 연주하는 사람]



반응형

'모조리 Data' 카테고리의 다른 글

[Gist] 왕복 비행기 일정 만들어주는 코드  (0) 2016.12.04
7.31  (0) 2015.07.31
The best books for every data scientist  (0) 2015.06.23
6.10 데이터의 단면  (0) 2015.06.10
6.9 페르미 추정  (0) 2015.06.09
Posted by JoeSung
,
http://www.analyticsvidhya.com/blog/2015/06/infographic-read-books-analytics-data-science/?utm_source=FBPage&utm_medium=Social&utm
_campaign=150623
반응형

'모조리 Data' 카테고리의 다른 글

7.31  (0) 2015.07.31
[입문] How to actually learn data science  (0) 2015.07.29
6.10 데이터의 단면  (0) 2015.06.10
6.9 페르미 추정  (0) 2015.06.09
빅데이터, 파이썬에게 길을 묻다.  (0) 2015.06.02
Posted by JoeSung
,



"데이터란 현실의 그림자다."

문석현 쿠팡 PO님이 했던 말인데, 요즘 들어 더 와 닿는 말이다.


자꾸 숫자로만 현상을 바라보다 보니, 이용자 한명 한명의 의미를 잃고 있었다.

숫자는 이용자들을 모두 "하나"라는 수치로 일원화 시킨다.

그들 한명 한명이 가지고 있는 의미를 모두 무시한채로.


반면, 옆 방 CS팀에서는 그 한명 한명이 전화하는 내용을 다 듣고 있고,

그들 한명 한명의 생각을 알고 있다. 다 소중한 이용자들이다.


데이터를 보는 이유는 현상을 파악하기 위함이다. 

그림자를 분석하는 목적은 그림자가 아니라 그림자를 만들어내는 사람들에게 있다.


과연 그 지표에 해당하는 "1"이 실제로 의미하는 것이 무엇인지

깊은 고민이 필요할 터 이다.


데이터를 앞으로 보아나갈 기회를 계속해서 잡을 요량이라면

그 숫자가 정말 의미하는게 무엇인지 깊이 생각하고 접근하고 다루어야겠다.


반응형
Posted by JoeSung
,