본문바로가기

자료 카테고리

전체 1
도서자료 0
학위논문 0
연속간행물·학술기사 1
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (0)
일반도서 (0)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (0)
학위논문 (0)
전체 (1)
국내기사 (1)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
기사명/저자명
지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 = Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality / 최석재, 이중원, 권오병 인기도
발행사항
서울 : 한국지능정보시스템학회, 2017.09.30
수록지명
지능정보연구 = Journal of intelligence and information systems. 제23권 3호 (2017. 9), pp.119-138
자료실
[서울관] 정기간행물실(524호)  도서위치안내(서울관)
외부기관 원문
외부기관 원문
제어번호
KINX2017263153
주기사항
한국연구재단에서 제공한 KCI 등재학술(후보)지임
원문

초록보기 더보기

최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다.

Recently, SNS has become an important channel for marketing as well as personal communication. However, cybercrime has also evolved with the development of information and communication technology, and illegal advertising is distributed to SNS in large quantity. As a result, personal information is lost and even monetary damages occur more frequently. In this study, we propose a method to analyze which sentences and documents, which have been sent to the SNS, are related to financial fraud.

First of all, as a conceptual framework, we developed a matrix of conceptual characteristics of cybercriminality on SNS and emergency management. We also suggested emergency management process which consists of Pre-Cybercriminality (e.g. risk identification) and Post-Cybercriminality steps. Among those we focused on risk identification in this paper.

The main process consists of data collection, preprocessing and analysis. First, we selected two words ’daechul(loan)’ and ‘sachae(private loan)’ as seed words and collected data with this word from SNS such as twitter. The collected data are given to the two researchers to decide whether they are related to the cybercriminality, particularly financial fraud, or not. Then we selected some of them as keywords if the vocabularies are related to the nominals and symbols. With the selected keywords, we searched and collected data from web materials such as twitter, news, blog, and more than 820,000 articles collected.

The collected articles were refined through preprocessing and made into learning data. The preprocessing process is divided into performing morphological analysis step, removing stop words step, and selecting valid part-of-speech step. In the morphological analysis step, a complex sentence is transformed into some morpheme units to enable mechanical analysis. In the removing stop words step, non-lexical elements such as numbers, punctuation marks, and double spaces are removed from the text.

In the step of selecting valid part-of-speech, only two kinds of nouns and symbols are considered. Since nouns could refer to things, the intent of message is expressed better than the other part-of-speech. Moreover, the more illegal the text is, the more frequently symbols are used.

The selected data is given ‘legal’ or ‘illegal’. To make the selected data as learning data through the preprocessing process, it is necessary to classify whether each data is legitimate or not. The processed data is then converted into Corpus type and Document-Term Matrix. Finally, the two types of ‘legal’ and ‘illegal’ files were mixed and randomly divided into learning data set and test data set. In this study, we set the learning data as 70% and the test data as 30%.

SVM was used as the discrimination algorithm. Since SVM requires gamma and cost values as the main parameters, we set gamma as 0.5 and cost as 10, based on the optimal value function. The cost is set higher than general cases. To show the feasibility of the idea proposed in this paper, we compared the proposed method with MLE (Maximum Likelihood Estimation), Term Frequency, and Collective Intelligence method. Overall accuracy and was used as the metric. As a result, the overall accuracy of the proposed method was 92.41% of illegal loan advertisement and 77.75% of illegal visit sales, which is apparently superior to that of the Term Frequency, MLE, etc. Hence, the result suggests that the proposed method is valid and usable practically.

In this paper, we propose a framework for crisis management caused by abnormalities of unstructured data sources such as SNS. We hope this study will contribute to the academia by identifying what to consider when applying the SVM-like discrimination algorithm to text analysis. Moreover, the study will also contribute to the practitioners in the field of brand management and opinion mining.

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
뉴스기사를 이용한 소비자의 경기심리지수 생성 = Construction of Consumer Confidence index based on Sentiment analysis using News articles 송민채, 신경식 pp.1-27 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 = Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality 최석재, 이중원, 권오병 pp.119-138 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
공간정보기반 클러스터링을 이용한 초고속인터넷 결합유형별 해지의 지역별 특성연구 = A Study on the Regional Characteristics of Broadband Internet Termination by Coupling Type using Spatial Information based Clustering 박장혁, 박상언, 김우주 pp.45-67 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 = Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information 최유지, 박도형 pp.155-175 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
온라인 상품평의 내용적 특성이 소비자의 인지된 유용성에 미치는 영향 = Impact of Semantic Characteristics on Perceived Helpfulness of Online Reviews 박윤주, 김경재 pp.29-44 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 = Efficient Topic Modeling by Mapping Global and Local Topics 최호창, 김남규 pp.69-94 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 = A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model 권순재, 김성현, 탁온식, 정현희 pp.95-118 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )
RNN(Recurrent Neural Network)을 이용한 기업부도예측모형에서 회계정보의 동적 변화 연구 = Dynamic forecasts of bankruptcy with Recurrent Neural Network model 권혁건, 이동규, 신민수 pp.139-153 원문보기 (음성지원, 국회도서관 방문 후 이용 가능 )

참고문헌 (33건) : 자료제공( 네이버학술정보 )더보기

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 Data Mining Techniques for Suspicious Email Detection: A Comparative Study. pp. 213-217 미소장
2 Cyber-Fraud is One Typo Away 네이버 미소장
3 Reading emotional words within sentences: The impact of arousal and valence on event-related potentials 네이버 미소장
4 Exploring the Use of Exchange Market Pressure and RMU Deviation Indicator for Early Warning System (EWS) in the ASEAN+3 Region 네이버 미소장
5 Crisis Management in Hindsight: Cognition, Communication, Coordination, and Control 네이버 미소장
6 An Efficient Estimation of Place Brand Image Power Based on Text Mining Technology 소장
7 Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being 소장
8 A Method of Analyzing Sentiment Polarity of Multilingual Social Media : A Case of Korean-Chinese Languages 소장
9 Liquid-Claim Production, Risk Management, and Bank Capital Structure: Why High Leverage is Optimal for Banks 네이버 미소장
10 Risk Management: History, Definition, and Critique 네이버 미소장
11 Management of catastrophic risks considering the existence of early warning systems 네이버 미소장
12 A grid portal for solving geoscience problems using distributed knowledge discovery services 네이버 미소장
13 The Value of Investing in Enterprise Risk Management 네이버 미소장
14 A B-cell time and place 네이버 미소장
15 Emergency and Disaster: Pervasive Risk and Public Bureaucracy in Developing Nations 네이버 미소장
16 Identifying disgruntled employee systems fraud risk through text mining: A simple solution for a multi-billion dollar problem 네이버 미소장
17 Internal fraud risk reduction: Results of a data mining case study 네이버 미소장
18 Text categorization with support vector machines: Learning with many relevant features, Technical Report LS8-Report. 미소장
19 A Method of Predicting Service Time Based on Voice of Customer Data 소장
20 Predictive Analysis of Cyber Crime Against Women in India and Laws Prohibiting Them. Vol. 4. pp. 1-6 미소장
21 Vertical Differentiation and a Comparison of Online Advertising Models 네이버 미소장
22 Guest Editors’ Introduction: Special Issue on Cyber Crime 네이버 미소장
23 The status of emergency management theory: Issues, barriers, and recommendations for improved scholarship. 미소장
24 Usage, barriers and measurement of social media marketing: An exploratory investigation of small and medium B2B brands 네이버 미소장
25 Criminal profiling and insider cyber crime 네이버 미소장
26 Risk Management and Firm Value: Evidence from Weather Derivatives 네이버 미소장
27 Emergency Management: A Challenge for Public Administration 네이버 미소장
28 The complete guide to business risk management. 미소장
29 A Bayesian Approach to Filtering Junk E-Mail. Vol. 62. pp. 98-105 미소장
30 A Methodology for Cyber Crime Identification using Email Corpus based on Gaussian Mixture Model 네이버 미소장
31 Collaboration and Leadership for Effective Emergency Management 네이버 미소장
32 Emergency knowledge management and social media technologies: A case study of the 2010 Haitian earthquake 네이버 미소장
33 A GAME THEORETIC OPTIMIZATION MODEL BETWEEN PROJECT RISK SET AND MEASURE SET 네이버 미소장

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기