
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 웹정보이용, 검색결과: 62

웹을 통해 제공되는 뉴스 페이지의 경우 필요한 정보 뿐 아니라 많은 불필요한 정보를 담고 있다. 이러한 불필요한 정보는 뉴스를 처리하는 시스템의 성능 저하와 비효율성을 가져온다. 이 연구에서는 웹 페이지로부터 뉴스 콘텐츠를 추출하기 위해 문장과 블록에 기반한 뉴스 기사 추출 방법을 제시하였다. 또한 이들을 결합하여 최적의 성능을 가져올 수 있는 방안을 모색하였다. 실험 결과, 웹 페이지에 대해 하이퍼링크 텍스트를 제거한 후 문장을 이용한 추출 방법을 적용하였을 때 효과적이었으며, 여기에 블록을 이용한 추출 방법과 결합하였을 때 더 좋은 결과를 가져왔다. 문장을 이용한 추출 방법은 추출 재현율을 높여주는 효과가 있는 것으로 나타났다.


The news pages provided through the web contain unnecessary information. This causes low performance and inefficiency of the news processing system. In this study, news content extraction methods, which are based on sentence identification and block-level tags news web pages, was suggested. To obtain optimal performance, combinations of these methods were applied. The results showed good performance when using an extraction method which applied the sentence identification and eliminated hyperlink text from web pages. Moreover, this method showed better results when combined with the extraction method which used block-level. Extraction methods, which used sentence identification, were effective for raising the extraction recall ratio.


웹사이트 디자인과 평가에 대한 연구는 정보과학분야, 컴퓨터분야, 인지과학분야, 산업디자인분야 등을 중심으로 활발하여 이루어져 왔다. 정보과학분야에서 웹사이트 디자인과 관련하여 중요하게 강조하는 부분은 이용자가 이용하기 쉬우며 이용자에게 친숙한 이용자 중심의 웹사이트를 디자인하는 것이다. 이러한 개념은 이용자와 디자이너를 별개의 집단으로 이해하고, 웹 디자이너들이 웹사이트를 디자인할 때에 이용자의 요구사항을 충분히 반영하여야 함을 강조한다. 이 연구에서는 이용자와 디자이너를 별개의 집단으로 보는 관점을 벗어나 최근 늘어나고 있는 집단인 웹사이트 이용자인 동시에 웹사이트 제작 경험이 있는 디자이너를 대상으로 하여 자신이 디자인한 웹사이트와 다른 연구 대상자들이 디자인한 웹사이트를 평가하도록 하였다. 질문지를 통한 자료를 분석한 결과 이용자이면서 디자이너인 218명의 연구 대상자들은 이용자의 관점과 디자이너의 관점에서 모두 웹사이트의 내용전달, 디자인의 단순성과 일괄성, 링크와 접근성 측면을 공통적으로 중요시 여기고 있었다.반면, 내용의 체계성과 풍부성, 화면구성 측면은 이용자 관점에서 중요한 고려사항으로 제시되었음에도 불구하고 실제 웹사이트 제작 시 중요성이 간과되고 있음을 알 수 있었다.


Diverse disciplines such as information science, cognitive science, and industrial design are actively engaged in the website evaluation research efforts. Information scientists emphasize the importance of user-centered and user-friendly website design, which is also easy to use. This idea is based on the understanding that the users and the designers are diffrerent ste of people. In addition, information scientists consider the practice of maximally incorporating uer inputs during the website design stage to be very important guideline. However, this study is based on a newly emerging population of website users who are also designers. 218 study participants evaluated the web sites that they designed in comparison to the websites designed by others. According to the survey data analysis, the study participants considered the content delivery, design simplicity, design consistency, and link access of the websites to be equally important from both users' and designers' perspectives. However, the content organization, rich content, and screen composition were underestimated from users' point of view.

김태승(경기대학교) ; 이동규(대림대학) 2005, Vol.22, No.4, pp.79-95 https://doi.org/10.3743/KOSIM.2005.22.4.079

본 연구는 2년제 전문대학 학생들을 대상으로 웹기반 온라인목록의 이용특성을 조사 연구한 것이다. 연구방법으로 이용자들의 특성을 분석하기 위하여 질문지법과 면접조사법을 통해 데이터를 수집하였으며, 수집된 데이터의 처리는 통계처리 프로그램인 SPSSWIN 10.1을 사용하여 분석하였다. 연구결과 이용행태, 검색결과 만족도, 웹 온라인목록의 선호도, 검색어 선정, 문헌정보학 전공자와 비전공자 간의 탐색성과 차이, 웹 온라인목록의 이용자교육의 필요성 등에 관한 결과를 얻었다. 이러한 분석결과를 근거로 하여 웹 온라인목록 이용 중에 발생하는 문제점과 어려움을 느끼는 기능들에 대해 개선방안을 제시하여 이용자들로 하여금 웹 온라인목록 이용의 효율성을 돕고자 하였다.


The aims of this study is to analyse the user's behavior, satisfaction, difficulties and selection of retrieval keywords for the use of Web-based OPAC in the College students. The methods of the questionnaire and the interview was applied to get the data and processed by using SPSSWIN 10.1. Several research results was proved the hypothesis such as differences between major subject of students in their fields. Furthermore, based on the result of this analysis, another purpose is to come up with the improvements of functions prompting difficulties and answers to problems found in the Web OPAC, helping them to use the Web OPAC efficiently.


최근에 이르러 차세대 웹 아키텍처인 시멘틱 웹에 관한 연구와 투자에 대한 관심이 계속해서 증대되고 있다. 정보학적인 관점에서, 차세대 웹 아키텍처인 시멘틱 웹은 하나의 거대한 메타데이터 조직으로 볼 수 있다. 시멘틱 웹을 거대한 메타데이터 조직으로 볼 수 있는 가장 큰 이유는, 시멘틱 웹을 구축과정에서 가장 중요한 단계 중 하나가 웹 정보자원에 대한 정형화된 메타데이터를 작성하는 것이기 때문이며, 이용자는 메타데이터를 이용하여 보다 쉽게 자신이 원하는 정보를 찾을 수 있다. 본 논문에서는, 시멘틱 웹 환경 하에서 서로 다른 정보체계구조를 지닌 개방형 전자도서관간의 상호운영성을 제공하기 위하여 새로운 방식의 응용프로화일 메타데이터구조를 개발하였다. 새로운 방식의 응용프로화일 메타데이터구조를 토대로, 개방형도서관모델에서 서로 다른 형태의 대규모 메타데이터를 통합하기 위한 공동서지목록 자동생성 및 통합검색 알고리즘을 개발하였다.


Recently there has been a growing interest in the investigation and development of the next generation web - the Semantic Web. From the perspective of a information science, the next generation web - Semantic Web is a metadata initiative. It is reason that One of important stage of Semantic Web Construction is adding formal metadata that describes a Web resource's content and so people can find easy material using metadata. In this paper, We designed new application profile metadata architecture as a way to serve as interoperability between various open digital libraries using different information architecture in Semantic Web environment. Based on new application profile metadata architecture, we developed union catalog automatic generation and union search algorithm to integrate heterogeneous huge-scale metadata in open digital library.

남재우(중앙대학교) ; 남태우(중앙대학교) 2010, Vol.27, No.4, pp.153-168 https://doi.org/10.3743/KOSIM.2010.27.4.153

스마트폰의 이용증가에 따라 도서관의 정보서비스는 새로운 패러다임을 맞이하고 있다. 본 연구는 도서관 모바일 웹사이트에 나타난 콘텐츠를 분석하여 정보의 구성현황 및 특징을 알아보기 위한 연구이다. 이를 위해 국외 26개 도서관을 선별하여 해당기관의 모바일 웹사이트를 조사하였고 사이트에 포함된 콘텐츠를 분석하였다. 그 결과로 모바일 웹사이트의 정보구조 및 핵심 콘텐츠를 분석하여 제시하였으며, 모바일 웹사이트에서 가장 많이 제공되고 있는 콘텐츠의 유형을 분석하였다. 연구의 결과는 도서관의 모바일 웹사이트 구축을 위한 참고자료가 될 수 있을 것이다.


The information service of library is getting into a new paradigm as the smart phone usage increases. This study analyzes the contents reflected on the library mobile website to figure out the structural condition and features of the information. For this study, 26 academic libraries in U.S. are selected for an examination of their mobile websites, and the contents on the sites were analyzed. This study analyzed the most frequent type of contents provided in the mobile website. As a result, this study suggested the information structure and core contents of the mobile website in detail. The outcome of this study is expected to be a reference for building the mobile website of library.

이수영(미국 미시간대학교 정보대학원) 2007, Vol.24, No.2, pp.29-44 https://doi.org/10.3743/KOSIM.2007.24.2.029

본 연구는 왜 이용자들이 정보탐색에 많은 노력을 기울이지 않는가를 알아보기 위하여 교육심리학분야에서 개발된 정신적 노력에 관한 개념을 웹 검색엔진과 도서관시스템 정보탐색행위에 적용하여 보았다. 실험실 환경에서 학부학생 총 15명을 대상으로 탐색실험을 실시하여, 탐색전 설문조사, 탐색후 설문조사, 탐색후 인터뷰, 생각 소리내어 말하기 (think-aloud), 로그데이터를 통하여 데이터를 수집하였다. 연구결과, 이용자들은 웹 검색엔진을 도서관시스템에 비하여 휠씬 쉽다고 인지하며 스스로 탐색에 대한 높은 자신감을 가지고 있었다. 이러한 이용자성향은 이용자들이 웹 탐색에 도서관탐색때보다 더 적은 노력을 기울이는 것과 깊은 연관성을 가지고 있는 것으로 나타났다. 이용자들의 정신적 노력에 관한 개념은 결과적으로 이용자들의 정보탐색 행위와 경험을 설명하는데 매우 유용한 것으로 밝혀졌다.


The purpose of this study was to explore whether the concept of amount of invested mental effort (AIME) developed in the field of educational psychology can help explain why people put so little effort into online searching. In this experimental study, two information retrieval systems a web search engine and a university library system were used to make a comparison. The data were collected from 15 undergraduate students through background questionnaires, think-aloud protocols, search logs, post-search questionnaires, and post-task interviews. The findings indicate that perception of the webs easy-ness and high levels of self confidence in searching capability led the subjects to put less effort into web searching than they do into library system searching. In addition, the perceived difficulty of search task influenced the extent of mental effort invested. The AIME proved a useful framework for understanding search behavior and user experience for both web search engines and library systems.

권혜진(동아일보) ; 정동열(이화여자대학교) 2010, Vol.27, No.4, pp.109-130 https://doi.org/10.3743/KOSIM.2010.27.4.109

본 연구의 목적은 기자직의 웹 행동 분석을 통해 웹 정보탐색행위 패턴의 특성을 규명하는 것이다. 이를 위해 본 연구는 기자직 23명을 대상으로 트랜잭션로그를 수집하여 분석하였다. 데이터 수집을 위하여 분석 대상의 컴퓨터에 웹 트래킹 소프트웨어를 설치하였으며, 2주 동안 총 39,860개의 웹 로그가 수집되었다. 세션의 시작과 종료 패턴, 단계별 이행 패턴, 순차규칙 모형이 분석되었으며, 기자직과 일반인의 웹 이용 패턴을 비교하였다. 이를 토대로 기자직의 웹 정보탐색행위 패턴을 사실확인형 탐색, 사실확인형 검색, 조사형 탐색, 조사형 검색 등 4가지 형태로 유형화하였다.


The purpose of this study is to identify th patterns in the news reporters’ information seeking behaviors by observing their web activities. For this purpose, transaction logs collected from 23 news reporters were analyzed. Web tracking software was installed to collect the data from their PCs, and a total of 39,860 web logs were collected in two weeks. Start and end pattern of sessions, transitional pattern by step, sequence rule model was analyzed and the pattern of Internet use was compared with the general public. the analysis of pattern derived a web information seeking behavior modes that consists of four types of behaviors: fact-checking browsing, fact-checking search, investigative browsing and investigative search.

진주영(명지대학교) ; 이해영(명지대학교) 2018, Vol.35, No.1, pp.183-203 https://doi.org/10.3743/KOSIM.2018.35.1.183

이용자 정보이용환경이 웹으로 변화하면서, 기록관리기관들도 종전보다 더 많은 서비스를 웹을 통해 제공하고 있다. 이 연구는 국가기록원 웹사이트를 이용하는 이용자의 최근 유입경로와 10년 반 동안 매달 상위 100개의 검색어 데이터를 분석하고 그에 맞는 기록정보서비스방안을 제시한다. 분석 결과 유입경로는 크게 포털 사이트별 접속, 국가별 접속, 유사기관별 접속 및 모바일 접속으로 분류할 수 있었다. 이용자들의 검색어를 분석한 결과 이용자들이 10년 반 동안 가장 많이 검색한 검색어는 ‘토지조사부’였으며, 꾸준한 관심을 갖고 검색한 검색어 또한 ‘토지조사부’였다. 그 외에 정부 기관에서 생산한 문서 또는 관보에 대한 관심도 높음을 확인하였다. 그리고 이용자들이 가장 많이 검색한 검색어와 꾸준히 등장한 검색어를 파악한 결과, 검색어들을 크게 토지, 일제강점기, 6․25 전쟁과 남북관계, 기록관리 및 이용으로 묶어볼 수 있었다. 분석결과를 토대로 포털 사이트 및 모바일 등을 활용한 국가기록원 웹사이트의 연계성 강화와 검색 서비스의 고도화 방안을 제안하였다. 이 연구는 이렇게 웹로그나 이용자 검색어 등을 분석하면 기록관리기관 이용자들에게 제공하는 서비스를 고도화할 수 있는 의미 있는 결과를 얻을 수 있음을 확인하였다.


As the users’ information use environment changes to the Web, the archives are providing more services on the Web than before. This study analyzes the users’ recent inflow route and the highly ranked 100 search terms of each month for 10 and half years in the Web site of National Archives of Korea, and suggests suitable information services. As a result of the analysis, it was found out that the inflow route could be divided into access from portal site, by country, from related institutions, and via mobile platform. As a result of analyzing the search terms of users for the last 10 and half years, the most frequently searched term turned out to be ‘Land Survey Register’, which was also the search term that was searched for with steady interests for 10 and half years. Also, other government documents or official gazettes were of great interests to users. As results of identifying the most frequently searched and steadily searched terms, we were able to categorize the search terms largely in terms of land, Japanese colonial period, the Korean war and relationship of North Korea and South Korea, and records management and use. Based on the results of the analysis, we suggested strengthening connection of the National Archives Web site with portal sites and mobile, and upgrading and improving search services of the National Archives. This study confirmed that the analysis of Web log and user search terms would yield meaningful results that could enhance the user services in archives.


기계가 정보의 의미를 이해하고 처리할 수 있도록 기존의 웹을 확장하는 것을 목적으로 하는 시멘틱 웹은 온톨로지를 이용하여 지식을 공유하게 된다. 본 논문에서는 정교한 질의의 처리를 위하여 온톨로지 내에 존재하는 의미 관계들을 질의의 확장을 위한 연관피드백 정보로 이용하는 방안을 제안한다. 실험은 도메인 온톨로지인 Medicine 온톨로지를 대상으로 하였으며, 출현 용어들의 빈도정보만을 이용한 키워드기반 문서검색과 제안한 온톨로지기반 문서검색의 성능을 비교하였다. 이 때, 두 시스템의 정확률과 재현율을 성능 평가의 기준으로 삼았다. 그 결과, 검색 엔진은 온톨로지에 정의된 개념들과 규칙들을 활용하면서 검색의 정확률을 향상시키는데 도움이 되었고 검색 성능을 향상시키기 위한 추론의 기반으로도 사용될 수 있었다.


For the purpose of extending the Web that is able to understand and process information by machine, Semantic Web shared knowledge in the ontology form. For exquisite query processing, this paper proposes a method to use semantic relations in the ontology as relevance feedback information to query expansion. We made experiment on pharmacy domain. And in order to verify the effectiveness of the semantic relation in the ontology, we compared a keyword based document retrieval system that gives weights by using the frequency information compared with an ontology based document retrieval system that uses relevant information existed in the ontology to a relevant feedback. From the evaluation of the retrieval performance, we knew that search engine used the concepts and relations in ontology for improving precision effectively. Also it used them for the basis of the inference for improvement the retrieval performance.

김용(전북대학교) ; 김문석(전라북도 교육청) ; 김윤범(전북대학교 문헌정보학과) ; 박재홍((주) 유라클) 2009, Vol.26, No.1, pp.81-105 https://doi.org/10.3743/KOSIM.2009.26.1.081

본 연구에서는 웹, IPTV 등의 콘텐츠 유통망에서의 개인화 추천서비스를 위하여 이용자의 콘텐츠 이용행위와 콘텐츠의 위치정보를 활용한 추천방법을 제안하고 있다. 추천방법의 성능향상을 위하여 이용자 및 콘텐츠 프로파일 생성방법과 함께, 이용자의 콘텐츠 이용행위를 암묵적 이용자 피드백으로서 학습과정에 적용하여 이용자 선호도를 분석하였다. 학습과정에서의 이용자 선호도 분석을 위하여 협업여과추천방법 및 내용기반추천방법을 적용하였다. 또한 보다 정확한 추천을 위한 최종 콘텐츠 추천을 위하여 웹사이트 상의 콘텐츠에 대한 위치정보를 활용한 추천방법을 제안하고 있다. 이를 통하여 보다 효율적이고 정확한 추천 서비스의 제공이 가능할 수 있다.


In this paper, we propose user contents using behavior and location information on contents on various channels, such as web, IPTV, for contents distribution. With methods to build user and contents profiles, contents using behavior as an implicit user feedback was applied into machine learning procedure for updating user profiles and contents preference. In machine learning procedure, contents-based and collaborative filtering methods were used to analyze user's contents preference. This study proposes contents location information on web sites for final recommendation contents as well. Finally, we refer to a generalized recommender system for personalization. With those methods, more effective and accurate recommendation service can be possible.
