'4차 산업에 필요한 분석 R' 카테고리의 글 목록

확률변수(確率變數, random variable)

어떠한 값이 되는가 하는 것이 확률 법칙에 의해 결정되는 변수를 확률변수 (random variable) 라 한다.

값이 이산적(離酸的, dirscrete) 일 때, 이산형(離酸形) 확률 변수
값이 연속적(連續的, continuous) 일 때 , 연속형(連續形) 확률변수라 한다.

확률변수라는 총체적인 의미를 나타낼 때에는 X와 같이 대문자로 나타내고, 확률변수의 표본값(데이터)으로서 실제값을 나타낼 때에 x와 같이 소문자로 나타내는 것이 일반 적인 표현 방법이다.

확률밀도함수(確率密度函數ㅡ probability density function, p.d.f)

확률변수 X 가 a ≤ X ≤ b의 값을 가지는 확률 P(a ≤ X ≤ b)가

와 같이 나타낼 수 있을 때, f(x)를 확률밀도함수(確率密度函數ㅡ probability density function)라 한다.

f(x)에는 다음과 같은 성질이 있다.

반대로 이 두 조건을 만족하는 함수는 모두 확률밀도함수가 될 수 있다.

위 그래프 "1.확률밀도 함수"의 확률을 도식적으로 나타내면 아래 (a)의 빗금친 부분의 면적에 해당하며, 특히 어떠한 특정한 값 x를 가질 확률은, 식 "2.확률밀도 함수의 성질" 과 같이 a와 b를 한없이 x 값에 접근 시킨 경우의 값으로 얻어지며, (b)와 같이 x에서 dx 를 생각하여 x와 x+dx 사이의 확률 f(x)dx 로 정의 할수 있다.

확률 밀도 함수 이것만 보면, 무엇을 설명 하고 싶은 건지 알수 없다.

아래의 예제를 보면 확률밀도 함수의 구간을 구하는 코드가 있다. 확률밀도 함수는 0~1까지의 숫자로 나타내며, 그 합이 1이여야 한다. 결국 확률 100% 넘지 못한다는 것이다. 구간으로 따지면 0 ≤ x ≤ 1 이다. 아래는 평균이 0이고 표준편차가 1인 정규분포의 밀도함수를 그린 것이고, -2 ≤ x ≤ -1 까지의 구간을 빗금 친 것이다.

# 평균이 0이고 표준편차가 1인 정규분포의 밀도함수를 만든 
# 이후 -2 부터 -1까지의 확률 밀도 함수의 그래프 구간을 그리면
  
  par(mfrow = c(1, 1))
  x <- seq(-3, 3, length = 100)
  y <- dnorm(x)
  plot(x, y, type = "l")

  xlim <- x[-2 <= x & -1 >= x] 
  ylim <- y[-2 <= x & -1 >= x]

  xlim <- c(xlim[1], xlim, tail(xlim, 1))
  ylim <- c(0, ylim, 0)
  
  polygon(xlim, ylim, density = 20)

'4차 산업에 필요한 분석 R > 통계와 확률 및 확률분포' 카테고리의 다른 글

통계와 확률에 대한 기본지식 (4)	2022.01.02

데이터 분석을 하거나, 머신러닝, 딥러닝 종류의 분석을 하려면, 통계학은 기본적으로 알고 가야 한다. 이것의 의미를 모르면, 어떠한 강의를 듣더라도 이해를 잘 못할 뿐 아니라, 어떠한 과제가 주어 졌을때, 기본적인 툴만 사용해서 해석 하는 Tooler 가 될수 있다.

Tooler 가 되면, 모든 분석에 있어서 Overfitting과 Underfitting에 대한 해석을 못해 분석 후 시스템에 적용시, 모델 결과 값은 좋은데, 실무에 적용하기 어려운 케이스가 매우 많다.

모집단(母集團, pupulation)과 표본(標本, sample)

어떠한 사물의 특징이나 현상을 알 필요가 있는 경우가 많다. 이러한 경우 일반적으로 관찰이나 측정을 해야 한다. 이러한 관찰이나 측정의 대상이 되는 사물이나 현상의 전체를 모집단(母集團, pupulation)이라고 한다.

그러나 특별한 경우를 제외하고 모집단의 양이 너무 커서 모집단 전체를 관찰하거나 측정 하는 것은 거의 불가능 하다.

실제로 관찰하기 위해 측정된 일부를 표본(標本, sample) 이라고 한다.

표본을 가지고 올때, 우리는 샘플링 하여, 표본을 가지고 온다. 보통 샘플링 할때는 우리는 Random 하게 샘플링하여 데이터를 추출 하는 경우가 많다.

흩어짐(dispesion)과 분포(分布, distribution)

어떠한 대상을 측정 하였을 경우, 얻어지는 측정값은 언제나 일정한 하나의 값이 아니고, 각각 다른 값이 되는 것이 일반적이다. 이렇게 측정값의 크기가 고르지 않은 것을 흩어집(dispersion)이라 하고, 이 흩어짐의 상태를 분포(分布, distribution)라고 한다.

표본평균(標本平均, sample mean)과 표본분산(標本分産, sample variance)

측정치의 크기는 일반적으로 다르므로 어떠한 분포를 사용하게 된다. 측정치의 분포상태를 정량적으로 나타내면 비교 등에 매우 편리하다.

분포상태를 나타내는 특성 중, 가장 중요한것이 1) 분포의 중심과 2) 흩어짐 정도 일것이다.

분포의 중심을 나타내는 양으로서 평균값이 사용되며, 표본에 대해서는 다음과 같이 산술(算術)평균으로 얻어 진다.

아래와 같은 기호를 사용하며, "바" 라고 부른다.

흩어짐의 정도를 나타내는 것은 평균값에서 값이 어느정도 떨어져 있는 가에 대한 것은로 데이터 양이 흩어짐의 정도를 나타낸 것을 분산(分産, variance) 라 한다.

예제 ) 평균 및 분산

어느 야구선수의 15년간 평균 홈련 데이터를 나타낸 것이다. 홈련의 평균과 분산을 R로 구현 하여라.

> # 홈련값의 변수를 x라고 한다. 
> x = c(24, 22, 26, 24, 18, 25, 24, 23, 24, 20, 26, 25, 21, 27, 29)
> plot(x)
> # 평균값을 구한다. 
> mean(x)
[1] 23.86667
> #분산을 구한다.
> var(x)
[1] 7.838095

공식은 조금 복잡 하지만, 평균은 mean() 함수를 사용하고 분산은 var() 함수를 사용한다.

치우침(bias)

어떠한 측정 대상이 값이 하나의 값이라 해도, 많은 회수를 측정을 하면 측정 값 언제나 하나의 값으로 측정되지 않고, 여러 값으로 측정 되는 것이 일반적이다. 이 때, 측정치 분포의 중심, 즉 평균값과 참값과의 차이를 치우침(bias)라 한다.

참값

원래 참값이란 모르는 값이나 측정 분야에서는 참값을, 대상이 되고 있는 양이 모범적인 방법(exemplar method), 즉 얻어진 데이터가 궁극적으로 사용될 목적에 대해 충분히 정확하다고 전문가들이 동의한 방법에 의해 측정되었을 때 얻어지라고 생각되는 값으로 보고 있다.

'4차 산업에 필요한 분석 R > 통계와 확률 및 확률분포' 카테고리의 다른 글

확률변수 및 확률 밀도 함수 (7)	2022.01.02

Ubuntu Linux R 설치 배경

Ubuntu Linux에서 R 과 RStudio 설치 하는 이유는 아래의 대화 속에 있다.

질문 : 안녕하세요 도움 덕분에 만들어 냈습니다. 스크립트에 한글이 있을때 되지 않아 전부영어로 바꾸었는데 혹시 어떤 프로그램을 쓰는 지 궁금 합니다.

답변 : 스크립트를 한글화 하려면 리눅스나 맥에서 해야 합니다. 대부분의 R 전문가들은 맥북을 가지고 있습니다. 저는 리눅스 서버를 가지고 있구요. Windows R은 한글 인코딩 체계가 리눅스와 달라 Windows R 에서 구현하시는 분은 매우 드뭅니다.

하지만, 대부분의 처음 사용자들은 Windows R을 하고 있으며, R을 습득 하기도 전에, 알수 없는 오류로 좌절하는 경우가 대부분이다.

Ubuntu Linux R 설치

R Base 4.X 대로 설치 하려면 아래와 같이 하여야 한다.

GPG Key 추가

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9

레포지트리키 추가

sudo add-apt-repository 'deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/'

이건은 R의 최신버전을 설치 할 수 있는 GPG Key와 레포지트리를 등록 하는 것이다.

위의 사항이 등록 되었으면 최신 버전의 R 설치가 가능하다. 아래의 명령어를 차레대로 입력 하여 보자.

sudo apt-get update
sudo apt-get install r-base
# R 설치 확인
sudo -i R

위와 같이 명령어를 입력 하였으면, 최신 버전의 R이 설치 되어 있음을 확인 할 수 있다.

R version 4.1.2 (2021-11-01) -- "Bird Hippie"
Copyright (C) 2021 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)

R은 자유 소프트웨어이며, 어떠한 형태의 보증없이 배포됩니다.
또한, 일정한 조건하에서 이것을 재배포 할 수 있습니다.
배포와 관련된 상세한 내용은 'license()' 또는 'licence()'을 통하여 확인할 수 있습니다.

R은 많은 기여자들이 참여하는 공동프로젝트입니다.
'contributors()'라고 입력하시면 이에 대한 더 많은 정보를 확인하실 수 있습니다.
그리고, R 또는 R 패키지들을 출판물에 인용하는 방법에 대해서는 'citation()'을 통해 확인하시길 부탁드립니다.

'demo()'를 입력하신다면 몇가지 데모를 보실 수 있으며, 'help()'를 입력하시면 온라인 도움말을 이용하실 수 있습니다.
또한, 'help.start()'의 입력을 통하여 HTML 브라우저에 의한 도움말을 사용하실수 있습니다
R의 종료를 원하시면 'q()'을 입력해주세요.

Ubuntu Linux Rstudio 설치

아래의 홈페이지에 접속해야 최선 버전의 Rstudio 를 설치 할 수 있다.

https://www.rstudio.com/products/rstudio/download-server/debian-ubuntu/

Download RStudio Server for Debian & Ubuntu

Download RStudio Server for Debian & Ubuntu Prerequisites RStudio Server requires Debian version 8 (or higher) or Ubuntu version 16.04 (or higher). Installing R RStudio requires a previous installation of R version 3.0.1 or higher. To install the latest ve

www.rstudio.com

아래 명령어와 같이 Rstudio를 설치 하면, 설치는 마무리가 된다.

sudo apt-get install gdebi-core
wget https://download2.rstudio.org/server/bionic/amd64/rstudio-server-2021.09.1-372-amd64.deb
sudo gdebi rstudio-server-2021.09.1-372-amd64.deb

devtools 와 rJava를 설치 하기 위한 환경 설정

devtools와 rJava 를 설치 하지 않으면 다양한 패키지를 사용할 수 없다. 따라서 아래와 같은 설정은 필수 적이다.

devtools 를 설치 하려면 아래의 패키지를 설치 하여야 한다. 아래 것을 설치 하지 않았다면 설치 하지 않았다는 오류가 뜬다.

sudo apt install build-essential libcurl4-gnutls-dev libxml2-dev libssl-dev libgit2-dev

rJava 환경 설정아래와 같이 한다.

# 저장소 업데이트 
sudo apt update -y
#R java 파일이 있을거라고 생각되는 위치에 업데이트
sudo R CMD javareconf

그리고 rJava를 쓰려면 아래와 같이 하이퍼 링크를 걸어야 한다.

ln -s ${JAVA_HOME}}/jre/lib/server/libjvm.dylib ${R_HOME}/lib/libjvm.dylib

Linux R은 Windows R 보다는 설치가 조금 까다롭지만 설치가 끝나고 나면, 코딩에서 알수 없는 문제를 접하지 않아서 좋다.

많은 사람들이 Linux 나 맥에서 R을 사용하기 바라면서 글을 마친다.

'4차 산업에 필요한 분석 R > R 설치' 카테고리의 다른 글

Windows 10 에서 R 및 Rstudio 설치 (5)	2022.01.01

R은 어느 O/S에서나 완벽하게 설치 되지 않는다. Windows R에서 설치하게 되면 한글 문제가 어김 없이 발생된다.

한글 Path 때문에, 패키지가 설치가 잘되지 않는 경우가 많다. 사용자 대부분이 Windows R을 사용하고 있다. 그리고, Linux R에서 Windows R으 데이터 셋을 내려 받으면, 당연 한글 오류가 나타난다.

하지만 Windows R에 설치만 잘되면, 패키지 설치 하기가 매우 쉽다.

R 다운로드 및 설치

아래의 패이지에서 다운로드 받아 실행 한다. 전부 다운로드 받은 다음 다음 버튼만 클릭 하면 된다.

https://cran.r-project.org/bin/windows/base/

Download R-4.1.2 for Windows. The R-project for statistical computing.

If you want to double-check that the package you have downloaded matches the package distributed by CRAN, you can compare the md5sum of the .exe to the fingerprint on the master server. You will need a version of md5sum for windows: both graphical and comm

cran.r-project.org

RStudio 다운로드 및 설치

아래의 사이트에 들어가서 다운로드를 받고 설치 한다.

https://www.rstudio.com/products/rstudio/download/#download

Download the RStudio IDE

RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, and a variety of robust tools for plotting, viewing history, debugging and managing

www.rstudio.com

이것도 마찮가지로 다음을 계속 클릭 하여 마무리 한다.

Rstudio 설치시 반드시 할일

Window 10 계정의 이름과 아이디가 영문이면 문제가 없으나, 만약에 한글이면 Rstudio 실행시 반드시 관리자 권한으로 실행 하여야 한다.

위와 같이 파일 위치를 열었으면, 아래와 같이 오른쪽 마우스 클릭 하고 관리자 권한 실행을 반드시 하여야 한다.

그러면, R에서 한글깨짐 오류가 발생 하지 않을 것이다. Windows R에서는 패키지 설치가 어렵지 않아, 이 부분은 넘어간다.

'4차 산업에 필요한 분석 R > R 설치' 카테고리의 다른 글

ubuntu Linux 에서 R 과 Rstudio 설치 (5)	2022.01.02

수학적인 표기법은 아래와 같이 매우 중요하다. 아래 사항이 Latex가 되는지 확인 해 보고 만약에 안된다고 하면, 주피터 노트북에서 Latex를 한 다음 그림 갭처로 가져올 예정 이다. Tistory는 Latex언어가 지원 하지 않으므로 다른 곳에서 작성 후 캡쳐 떠서 내용을 진행 할 예정 이다.

모든 것을 수식 대신 말로 설명 하려 하였으나, 일부는 수식으로 설명 해야 할 것이 있어서, 수식으로 설명 하겠다.

위의 수식은 엑셀 행과 열, 그리고 행렬 정도 알게 되면 쉽게 이해 할 수 있는 있는 내용이다. 그런데 이런 기호들을 모르면, 향후 설명할 내용에 대한 이해 하기가 어렵다.

그리고 수식상 사용되는 기호들은 아래와 같다.

앞으로 설명 할때, 이것에 대한 기호가 필요 할대 마다 다시 설명할 예정이다.

'4차 산업에 필요한 분석 R > 용어정리' 카테고리의 다른 글

머신러닝에서의 용어정리 (5)	2022.01.01
통계학에서의 용어[변수]정리 (2)	2022.01.01
신뢰성 공학에서의 용어정리 (0)	2022.01.01

'예측모델"에 원하는 결과를 예측하기 위해 데이터간에 숨겨진 관계를 찾아내는 과정을 표현하는 많은 명칭 중 하나다. 많은 과학 영역에서 이 분야에 기여하고 있다.

샘플, 데이터 값, 관측값, 경우라는 단어가 모두 고객, 환자, 화합물 등 단일을 독립적인 데이터 단위를 나타낸다. 샘플이라는 단어는 훈련 집합 샘플 같은 데이터의 부분 집합을 나타내는 데도 사용된다. 글에서 이런 용어가 사용될 때는 문맥이 정확하게 드러나 있어야 한다.
훈련 집합은 모델 개발에 사용되는 데이터 집합이고, 테스트 집합이나 검증 집합은 후보 모델 최종 집합의 성능 평가만 위해 사용된다.
예측변수, 독립변수, 속성, 기술자는 예측 방정식의 입력값으로 사용되는 데이터이다.
결과값, 종속변수, 목표값, 클래스, 응답값은 예측된 결과 이벤트나 결과값 수치에 따른다.
연속형 데이터는 자연수나 수치 척도를 갖는다. 혈압이나 물건의 가격, 욕실 개수는 모두 연속형이다. 욕실의 갯의 경우, 개수는 분수가 될 수 없지만 그래도 연속형 데이터로 다룬다.
명목형, 속성형, 이산형 데이터라고도 불리는 범주형 데이터는 척도가 따로 없는 특정값을 갖는 형태다. 이런 데이터의 예로는 신용등급("좋음","나쁨") 이나 색상 ("빨강", "파랑") 등이 있다.
모델 구축 및 훈련, 인수 추정 모두 모델 방정식에서 데이터를 사용해 값을 추정하는 과정을 거친다.

'4차 산업에 필요한 분석 R > 용어정리' 카테고리의 다른 글

수학적인 표기법 (0)	2022.01.01
통계학에서의 용어[변수]정리 (2)	2022.01.01
신뢰성 공학에서의 용어정리 (0)	2022.01.01

각 변수간 기능적 관계를 중심으로 한 분류

1) 독립변수

독립변수는 일정하게 전제된 원인을 가져다 주는 기능을 하는 변수로서, 실험 설계에 있어서는 연구자에 의하여 조작되는 변수를 말한다. 독립변수는 원인 변수 또는 예측변수라고 불린다. 실험 연구에서 독립 변수는 연구자에 의해 조작되는 변수를 의미 하며, 사회조사연구에서는 연구자의 능등적 개입이 아닌 논리적 선행조건의 개념으로 파악 된다.

2 ) 종속변수

독립변수의 원인을 받아 일정하게 전제된 결과를 나타낸는 기능을 하는 변수로서 실험 설계에 있어서는 독립변수의 변이에 따라 변할 것으로 예측되는 변수(독립변수의 결과)이다. 종속변수는 결과변수, 피설명 변수, 피예측 변수라고도 한다. 실험적 연구에 있어서 종속 변수는 독립 변수의 변이 또는 변화에 따라 자연히 변하는 것으로 결과적인 예측 변수라고 할 수 있다.

3) 매개변수

이는 종속변수에 영향을 주는 변수이다. 그러나 종속변수에 대하여 영향을 준다고 해서, 독립 변수의 경우처럼 명백한 것이 아니고 종속변수의 결과를 그 규정된 독립변수에 의하여 전부 설명하지 못하든지 또는 전혀 설명되지 않은 것을 설명이 가능 하도록 해주는 역할을 하는 변수를 말한다.

매개 변수는 독립변수에서 종속변수에 이르는 동작에 표함된 시간적.논리적 과정에 대한 좀더 정확한 이해를 가능케 함으로써 원인과 결과에 대한 지적인 탐색의 길잡이 역할을 하는 변수이다.

4) 선행변수

인과관계에서 독립변수에 앞서변수 독립변수에 유효한 영향력을 행사하는 변수를 말한다.

선행변수 -> 독립변수 -> 매개변수 -> 속속변수

5) 외재변수

외재 변수는 독립변수와 종속변수의 관계가 표면적으로는 인과적 관계에 있는 것처럼 보이는 경우에 실제로는 두 변수가 우연히 어떤 변수와 연결되어 관계가 있는 것처럼 보이는 제3의 변수로 허위 변수라고도 한다. 이때, 다른 변수의 영향을 통제하면 두 변수의 관계가 사라지게 되는데 이 통제되는 변수를 외재 변수라 한다.

6) 통제 변수

통제 변수란 실험상에서 적절히 통제된 변수이다. 실험과정에서 한 변수에 대하여 통제 한다는 것은 그 통제 변수의 각 수준을 따로 취해 독립변수와 종속변수의 원래 관계가 통제변수의 각 수준에서 어떻게 변하는지를 살펴본다는 것을 의미 한다.

변수가 갖는 속성의 정도 또는 종류를 중심으로 한 분류

1) 연속변수

이는 수입, 연령, 태도 등과 같이 변수가 갖는 속성의 양적 정도에 따라 연속체를 기준으로 구별되는 변수이다.

2) 불연속변수

이는 변수가 갖는 전체적 성격의 종류에 따라 카테고리화되는 변수를 말한다. 불연속변수의 예로서 성으로서의 남녀, 종교로서의 불교/기독교/유교 등 사회적 신분으로서 상.중.하 등을 들 수 있는데, 이것들은 변수의 속성에 따라 별개의 카테고리로 분류되는 것이다.

※ 주의 사항

변수의 용어는 통계학하고, 머신러닝/딥러닝 용어 차이가 매우 크다. 머신러닝에서 예측변수가 뭐라 생각이 되는가? 독립변수 있다. 그리고 피처 값은 무엇이라하는가? 이것도 독립 변수이다. 머신러닝에서 종속 변수는 Target이 존재 한다.

'4차 산업에 필요한 분석 R > 용어정리' 카테고리의 다른 글

수학적인 표기법 (0)	2022.01.01
머신러닝에서의 용어정리 (5)	2022.01.01
신뢰성 공학에서의 용어정리 (0)	2022.01.01

과학이나 공학에서 사용되는 각종 용어에 대한 정의, 설계에서의 문제의 정의(problem definition) 등, 정의의 문제는 매우 중요하다. 그것은 그 정의에 따라 대상이 되는 사물이나 무제에 대한 본질이 거의 규정되고, 그 규정된 본질에 딸라, 그 이후의 전개가 체계적이지 목하며, 문제 해결이 어려워 진다.

신뢰성 (信賴性, relaiability)

신뢰성이란 다음과 같이 정의하는 것이 일반적이다.

" 어떤 제품, 부품 또는 시스템이 규정된 조건하에서 지정된 기간에 걸쳐 요구되는 기능을 유지 수행하는 확률"

확률로 정의 되므로, 수학적 표현 방법이 사용된다. 신뢰도라는 용어가 대신 사용되는 경우도 많다. 신뢰성이라는 용어는 제2차 대전 기간 중에 미국에서 전자장치의 고장, 수명추정과 관련하여 도입된 것으로 알려 졌다.

파손(破損, failure) 또는 고장(failure)

신뢰성이 없는, 즉 "요구되는 기능을 수행하지 못하는 경우"를 파손(破損. failure) 또는 고장(failure) 라고 한다.

파괴(fracture)

파손과 비슷한 용여 파괴라는 것이 있다. 전혀 다른 개념이므로 혼동하지 않도록 하여야 한다. 파괴에 관해서도 엄밀한 정의가 있으나, 가장 쉽게 표현하면, "물체가 둘 이상으로 분리되는 현상"을 말한다. 파괴가 되지 않아도 파손이 될 수 있으며, 파괴가 되어도 파손이 되지 않는 경우가 얼마든지 가능 하다.

안전성(安全性, safety)

안전성이라는 용어는 신뢰성과 혼동하기 쉽다.

통상적으로 안전하다라고 하는 것은 인간에 대해 피해를 줄 가능성이 거의 없는 상황을 말한다. 반대로 피해를 줄 가능성이 있는 경우 위험(危嶮, dangerous, risky)하다고 한다. 여기서 피해는 인명(人命)에 대한 것은 물론, 도난이나 경제적 활동으로서의 투자 등에 의해 발생하는 모든 것을 포함 한다.

안전이란 피해 가능성과 연관된 개념으로, 본질적으로 확률적인 개념이라 말 할 수가 있다.

안전성은 안전의 정도를 나타내는 용어로 , 다음과 같이 확률적특성을 포함한 위혐도에 의해 평가 하는 것이 일반적이다.

위험도(危嶮道, risk)는 다음과 같이 정의되는 양이다.

위험도(risk) = 피해발생확률 X 피해크기

용어 리스크(risk)

위에서는 영어의 risk를 위험도라 번역하여 사용하였으나, 국내에서는 위험이라 번역하거나, 그대로 리스크(risk)라고 사용하는 경우도 많다. 대체로 위험 또는 위험이라 하면, 바람직하지 못한, 매우 부정적인 나쁘다는 위미가 강하나 risk의 의미에서 반드시 부정적인 면만 있는 것은 아니기 때문이다.

ex) risk-taker(모험적인 것을 즐기는 사람, 승부사), country risk (국가 신용도) risk의 의미에는, 불확실성이 매우 높아 실패할 가능성이 크다는 의미가 강하다고 보는 것이 좋을 것이다. 한편 실패하는 것은 언제나 부정적인 것만은 아니다.

한편 risk(리스크)라는 용어는, 공학이나 기술 분야 뿐만 아니라, 경제 분야, 의학, 각종 과학분에서 널리 사용되고 있어, 그정의에 관해서는 약간씩 다를 수가 있다.

리스크(risk, 위험도)는 위식에서 알수 있는 바와 같이, 피해 발생확률에 피해의 크기를 곱한 것으로, 발생확률보다 피해의 가능성에 중점을 두고 있다고 볼 수가 있다. 발생확률은 신뢰성과 관련된 순수학 공학적 문제일 것이나, 피해의 크기는 경제 및 사회에 미치는 영향과 밀접한 관계가 있는 문제 이며, 사람들의 인식에도 의존할 가능성이 크므로, 그 평가는 반드시 쉽지 않다고 보는 것이 좋을 것이다.

또 다른 한편, 리스크 값이 정량적으로 같다하여도, 리스크에 대한 사람의 인식(perception of risk)은 크게 다를 수 있다.

안전계수(安全係數, safety factor)

기계공학에서와 같이, 설계에서의 재료의 강도가 문제가 되는 분야에서의 안전성을 나타내는 양으로 안전계수라는 것을 많이 사용해 오고 있다. 안전계수는 다음과 같이 정의 된다.

안전계수 = 재료의 강도 / 허용응력

여기서 아용되는 재료의 강도와 허용응력은 각각 어떠한 하나의 확정된 특정 값으로, 평균치적 특성을 가진 값이다.

안전계수는, 예상한 하중과 다른 과대한 하중이 작용하는 경우 등, 설계 시 가정한 각종 조건에 대한 불확실성을 보완하기 위한 일종의 여유(margin)라는 의미가 크다. 확률적 특성을 지닌 안전성을 엄밀하게 나타내지 못한다는 결점이 있다. 기계공학에서 신뢰성 공학이 필요한 이유가 여기에 있다.

근래에는 재료의 강도와 하중의 확률적 특성을 고려한 안전계수 개념이 도입되어, 사용되는 추세에 있다.

위의 용어는 현업 업무에서 많이 쓰는 용어이다. 신뢰성, 위험성, 고장, 파손, 안전성, 안전계수 등이다.

설비관리조직(maintenance)는 설비 유지 관리를 하는 업무를 하지만, 설비를 들여올때 위의 4가지 항목을 반드시 검토하여 설비를 들여온다.

아래의 책의 내용을 가져온 것이다. 자세히 알고 싶으면 아래의 책을 구입하여 보면 된다.

http://www.yes24.com/Product/Goods/9318530

'4차 산업에 필요한 분석 R > 용어정리' 카테고리의 다른 글

수학적인 표기법 (0)	2022.01.01
머신러닝에서의 용어정리 (5)	2022.01.01
통계학에서의 용어[변수]정리 (2)	2022.01.01