posted by 내.맘.대.로 2024. 11. 6. 10:10

내맘대로의 EPUBGUIDE.NET에서 편집자의 의도를 그대로 살려 전자책을 제작해 드립니다.

종이책의 편집 스타일을 최대한 유지하며, 팝업 주석 처리, 이미지 확대 축소 등 전자책의 장점을 반영하여 전자책을 제작합니다. 탬플릿을 사용하지 않고, 책 한권 한권 고유 스타일을 살리기 때문에 전자책에서도 종이책 디자인을 느낄 수 있습니다.

한국출판문화진흥원의 [텍스트형 전자책 제작 지원 사업] 선정 도서는 ‘제작 난이도별 제작비 산정 기준에 근거하여’ 제작 단가를 산정하고, 일정에 맞춰 제작을 해 드리니 많은 문의 바랍니다.

자세한 내용은 여기로: https://www.epubguide.net/notice/309

오래 전 작성된 글은 현재의 Sigil 버전과 차이가 날 수 있습니다. 등록 일자를 확인 하고 1년 이상 지난 글은 변경된 내용이 있는지 확인하시기 바랍니다.

저사양 PC에서 ollama Web UI를 이용해 AI를 돌려보고 있어요.

PC는 Firebat T8이라는 모델로, 인텔 N100 CPU를 쓰는 저사양 컴퓨터입니다.

손바닥 만한, 장난감 수준의 컴퓨터예요.

여기에 ollama Web UI를 설치하고, 공개 LLM 모델을 돌려보는 중입니다.

 

여러 모델을 돌려본 결과, 이 PC에서 그나마 잘 돌아가는 3개 모델을 선택했습니다.

선택 기준은 다음과 같아요.

 

1. 한국어를 잘 한다.

2. 속도가 너무 느려서는 안된다.(그렇다고 GPT나 Gemini 처럼 대화할 정도는 아님. 인내심 필요)

3. 답변 내용이 그럴 듯 해야한다.(환각 현상이 있더라도 내용의 일관성, 문장 구성 수준이 높아야 함)

 

이 정도 기준으로 고른 모델은 다음과 같습니다.

 

1. llama3.2 - 3.2b(1.9gb)

2. gemma2 9b(5.1gb)

3. mistral-nemo:latest 12.2b(6.6gb)

 

학습 데이터의 양( = 모델의 용량에 정비례, 응답 속도에 반비례)에 따라 성능 차이가 크기 때문에 저 세 모델 자체의 성능 비교를 하려는 것은 아닙니다. 그리고 영어 실력이 아닌 한국어 실력을 비교하기 위한 것입니다. 그렇기 때문에 영어로는 좋은 결과를 보여줘도 한국어 결과는 형편 없을 수 있지요.

 

세 모델을 비교하기 위해 아래 프롬프트를 입력했습니다.

 

노인과 바다 내용 1000자 이내로 요약해줘

 

모델의 규모 차이가 크기 때문에 응답 속도는 고려하지 않았어요.

결과는 아래와 같습니다.

 

1. llama3.2 - 3.2b

노인의 바다 내용은 한국의 전설적인 소설로, 1936년 author 공민주가 쓴 소설이다. 소설은 기원전 3천년 전에 عاش았던 노인과 그의 아들 간의 심오한 대화를 통해 인간의 삶과 죽음에 대한 깊은 생각을 담고 있다.

노인의 바다 내용은 노인의 아들이 죽었다는 것을 알게 된 후, 노인은 바다에서 자신의 죽음을 기대하고 있다. 그는 바다와 함께 일상적인 것처럼 보이는 일상생활을 살고 있으며, 그의 아들과의 대화를 통해 자신의 삶과 죽음에 대한 생각을 나열한다.

소설은 노인의 아들이 죽었다는 것을 알게 된 후, 노인은 바다에서 자신의 죽음을 기대하고 있다. 그는 바다와 함께 일상적인 것처럼 보이는 일상생활을 살고 있으며, 그의 아들과의 대화를 통해 자신의 삶과 죽음에 대한 생각을 나열한다.

노인의 바다는 인간의 삶과 죽음에 대한 깊은 생각을 담고 있다. 소설은 노인의 아들이 죽었다는 것을 알게 된 후, 노인은 바다에서 자신의 죽음을 기대하고 있다. 그는 바다와 함께 일상적인 것처럼 보이는 일상생활을 살고 있으며, 그의 아들과의 대화를 통해 자신의 삶과 죽음에 대한 생각을 나열한다.

노인의 바다는 인간의 삶과 죽음에 대한 깊은 생각을 담고 있다. 소설은 노인의 아들이 죽었다는 것을 알게 된 후, 노인은 바다에서 자신의 죽음을 기대하고 있다. 그는 바다와 함께 일상적인 것처럼 보이는 일상생활을 살고 있으며, 그의 아들과의 대화를 통해 자신의 삶과 죽음에 대한 생각을 나열한다.

노인의 바다는 인간의 삶과 죽음에 대한 깊은 생각을 담고 있다.

 

2. gemma2 9b

'노인과 바다'는 에르네스팅 헤밍웨이의 단편 소설로, 피어난 노년의 고독과 인간정신의 강함 을 그린 작품입니다.

84일 동안 물고기를 잡지 못한 노련한 어부 산티아고가 다시 한번 바다로 나선 이야기입니다. 그는 오래도록 찾던 대형 마라를 가슴에 안고 잠재적인 승리를 향해 용맹히 도전합니다.

물고리와의 인간과 동물 사이의 치열한 싸움은 단순한 생존을 위한 경쟁을 넘어, 노인이 자신의 존엄성과 정체성을 되찾기 위한 고군분투로 그려집니다. 마라를 잡으려는 의지와 끊임없는 노력은 노인의 신체적 약점을 강조하며 동시에 그의 영적인 강함을 드러냅니다.

그러나 산티아고는 오랫동안 만든 노력 끝에 큰 마라를 붙잡았지만, 자연과 인간의 관계 속에서 나타나는 운명적 고난 을 맞이합니다. 대형 곰과 해수범들이 공격하며 그의 노력은 무너지고 아쉬운 결말로 이어집니다.

결국 산티아고는 큰 마라를 얻지는 못했지만, 그 과정에서 사랑, 위대함, 그리고 인간의 불굴의 의지를 보여줍니다.

'노인과 바다'는 단순한 어부 이야기가 아닌, 고독, 갈등, 이겨내는 힘 등에 대한 심오한 성찰을 담고 있습니다. 작품은 그 단결된 스토리와 독창적인 문체로 전 세계 독자들에게 영감을 주었습니다.

 

3. mistral-nemo 12.2b

헤밍웨이가 쓴 "노인과 바다"는 한 늙은 ры잡이, 산티아고가 커다란 흰 물개와 대결하는 이야기를 그린 소설입니다.besar fish.그는 오랫동안 운이 없게 싸우고 있던 와중에 마침내 거대한 흰 고래를 낚싯대에 걸지만 고기는 너무 크고 강해서 산티아고를 바다로 끌고 갑니다.마침내 고기가 피로를 느끼고 포기한 순간, 고기는 해변으로 이끌려가 다른 사람들이 잡을 수 있게 됩니다.

그러나 산티아고는 이 경험으로 인해 마을 사람들의 존경과 경의를 받게 되고 그는 자신의 운이 돌아온 것이라고 믿습니다.그러나 그가 다시 바다로 나가기 위해 준비를 할 때 심장마비로 사망합니다.그의 죽음은 그의 용기와 인내, 그리고 그의 삶에서 가장 위대한 순간을 기록하는 데 일조했습니다.

이 작품은 헤밍웨이의 다른 작품과 마찬가지로 간결하고 세련된 문체로 쓰여 있으며 상징적 의미를 가지고 있습니다. 이 이야기는 인간의 투쟁심과 불굴의 정신, 운명적인 힘 등에 대한 탐구입니다.

 

이 결과에서 llama3.2가 엉뚱한 답변을 내놨으니 품질이 떨어진다는 결론을 내리면 안됩니다. llama3.2를 학습할 때 한국어 노인과 바다가 없을 가능성이 높을 뿐입니다.

각 AI가 만들어 낸 한국어 문장을 보고 어떤 모델의 문장이 매끄러운지를 보세요.

창작에 활용하는 모델이라면 환각현상이 있어도 사용할 수 있겠지만, 실무에 적용하고 싶다면 현실적인 데이터를 제공하는 모델이 필요할 거예요.

 

다음은 번역입니다.

 

이 내용을 한국어로 번역해줘. "He was an old man who fished alone in a skiff in the Gulf Stream and he had gone eighty-four days now without taking a fish. In the first forty days a boy had been with him. But after forty days without a fish the boy's parents had told him that the old man was now definitely and finally salao, which is the worst form of unlucky, and the boy had gone at their orders in another boat which caught three good fish the first week. It made the boy sad to see the old man come in each day with his skiff empty and he always went down to help him carry either the coiled lines or the gaff and harpoon and the sail that was furled around the mast. The sail was patched with flour sacks and, furled, it looked like the flag of permanent defeat."

 

1. llama3.2 - 3.2b (2579초)

그는 Gulf 스트림의 피크에서 가방을 실어 고기잡이로 solitary로 매일매일어렸고, 지금은 eighty-four일이 지났으며, 이에까지 그는 한 마리의 물고기를 잡지 못했다. 처음으로 40일은 소년과 함께 어들었다. 그러나 40일이 지났다면, 소년의 부모는 그들이 결코 바뀔 수 없는 불 уда를 받았을 것이라는 것이 명확하여, 소년은 그들의 지시로 다른 보트에 들어서고, 첫 주에 세 개의 좋은 물고기를 잡았다. 소년이 항상 그에게 어서오게 하는 것은 이가 아름답지 못할 것이라는 것을 알기 때문에, 소년은 그와 함께 가방을 실어 고기잡이에서만 일할 때는 항상 그의 피크가 비었습니다. 그는 매일이 보트를 내리며 그에게 도움을 드리고, 가방의 라인과 가비, harpoon을 들어주고, Mast에 부착된 비행기를 쑨고 있습니다. 비행기는 흰가방의 조각을 가로지르기 때문에, 비행기가 휘어질 때는 승리하지 못한 것처럼 보입니다.

 

2. gemma2 9b (13777초)

그는 골프 스트림에서 뗏배를 타고 홀로 어부 생활을 하던 노인이었습니다. 지금까지 84일 동안 단 한 마리의 물고기를 잡지 못했습니다. 처음에는 40일 동안 소년이 함께했지만, 어떤 물고기도 잡지 못한 후 소년의 부모님들은 노인이 이제 확실히 그리고 최후로 '살아오'라고 말하여 가장 나쁜 운을 당했다고 생각하셨습니다. 그래서 소년은 부모님의 명령에 따라 다른 배에서 출항했는데, 첫 주만에 3마리의 좋은 물고기를 잡았습니다. 소년에게는 매일 노인이 비어있는 뗏배로 돌아오는 모습을 보니 슬퍼했습니다. 그는 항상 노인의 도움을 위해 꼬인 줄이나, 창과 화살가락 그리고 돛대 주위에 말린 돛을 들어올리게 되었습니다. 그 돛은 박력 가루를 이용하여 수선했고, 말리는 모습이 보이면 영원한 패배의 상징처럼 보였습니다.

 

3. mistral-nemo 12.2b(537940초)

그는 만년고기잡이 노인이었다. 그는 단독으로 바랑카라는 작은 배로 메인 만에 출어하고 있었지만, 이젠 84일째 아무것도 잡지 못한 채였다. 처음 40일간은 소년과 함께 다녔지만, 사흘째 되는 날부터도 고기를 못 잡아 그 소년의 부모가 "이제 노인은 완전히 불운하다"고 판단해 그 아이더러 다른 배를 타고 나가게 했다. 소년의 배는 첫 주에 세 마리의 좋은 생선을 건졌다. 매일 빈 배로 돌아오시는 노인을 보는 것이 어린이에게는 슬픈 일이었지만, 그는 언제나 내려가 노인의 고기잡이 도구인 말린 밧줄이나 작살과 돛을 도울 준비가 되어 있었다. 돛은 밀가루 자루로补한 것이었다. 그리고 접어놓으니 마치 영구히 패배한 깃발 같았다.

 

번역용으로 사용하려면 mistral이 좋아보입니다. gemma2는 속도가 비교적 빠르고 초벌 번역 수준은 보여줍니다. llama3.2은 속도가 가장 빠르지만 번역 품질은 떨어집니다.

 

이 외에도 몇가지 더 테스트 해 봤습니다.

[탄소를 대신해 유기화합물 역할을 할 수 있는 원소는 뭐가 있어?] 같은 질문이요.

가장 사실에 근거한 답변을 내놓은 것은 gemma2였고 mistral-nemo은 시간이 오래 걸렸지만 엉뚱한 답변을 내놨습니다.

모두 한국어로 질문하고 답변을 받았기 때문에 영어로 질문을 했을 때는 다른 결과가 나올 수 있습니다.

 

결론.

속도는 llama3.2b가 가장 빠릅니다. 저사양 PC에서도 돌려볼 만 합니다. 하지만 전반적인 한국어 답변 수준은 떨어집니다.

gemma2는 한국어를 잘 구현하고 사실에 근거한 답변을 제시했습니다. mistral-nemo는 속도가 느려 저사양 PC에서 돌리려면 인내심이 필요합니다.

 

질문이 몇개로 한정되어 있기 때문에 다양한 분야의 질문을 던지면 다른 결과가 나올 수 있습니다.그리고 영어로 사용할 때의 결과도 크게 달라질 수 있습니다.

 

llama 3.1 8b vs gemma2 9b 등 비슷한 크기의 모델일 때 역시 다른 결과가 나올 수 있습니다. 같은 사이즈의 모델로 비교해야 할 수도 있지만, 이건 논문이 아닙니다. 그냥 재미로 한 비교일 뿐입니다. 하지만 gemma2 2b, 9b, 27b 처럼 같은 모델의 크기별 결과, 다른 모델의 유사한 크기 별 결과도 비교해 보고 싶긴 하네요.

 

phi3.5는 한국어를 잘 구현하지 못해 제외했습니다. 다른 모델과 비교하면 한국어용으로 사용할 만한 수준은 아닙니다.

반응형
posted by 내.맘.대.로 2024. 11. 6. 08:17

내맘대로의 EPUBGUIDE.NET에서 편집자의 의도를 그대로 살려 전자책을 제작해 드립니다.

종이책의 편집 스타일을 최대한 유지하며, 팝업 주석 처리, 이미지 확대 축소 등 전자책의 장점을 반영하여 전자책을 제작합니다. 탬플릿을 사용하지 않고, 책 한권 한권 고유 스타일을 살리기 때문에 전자책에서도 종이책 디자인을 느낄 수 있습니다.

한국출판문화진흥원의 [텍스트형 전자책 제작 지원 사업] 선정 도서는 ‘제작 난이도별 제작비 산정 기준에 근거하여’ 제작 단가를 산정하고, 일정에 맞춰 제작을 해 드리니 많은 문의 바랍니다.

자세한 내용은 여기로: https://www.epubguide.net/notice/309

오래 전 작성된 글은 현재의 Sigil 버전과 차이가 날 수 있습니다. 등록 일자를 확인 하고 1년 이상 지난 글은 변경된 내용이 있는지 확인하시기 바랍니다.

 

전자책 제작 관련 블로그를 운영하고, 강의도 하다 보니

이런 저런 질문을 많이 받습니다.

웬만하면 답변을 보내려고 하지만, 10개 질문 중 답변 할 수 있는 것은 2~3개 밖에 안돼요.

제 실력이 한참 부족한가봅니다. 웬만한 질문에 답변 할 능력이 안되는 것을 보면요.

 

질문의 품격이 낮으면, 답변의 품격도 떨어집니다.

어떤 사람들은 답변이 왜 이모양이냐며 화를 내기도 하는데,

답변이 엉망이면, 질문이 엉망이 아닐까 하는 생각을 먼저 해 보세요.

아래는, 제가 답변을 달지 않았거나, 답변 받은 사람들이 기분 나쁠 수 있는 답변을 한 질문들입니다.

질문을 이렇게 하는 사람들이 정말 많아요.

 

1)

문제가 생겨서 이렇게 혹시나 문의글 작성해봅니다. 외부,내부 CSS가 전혀 적용이 되질 않습니다.

* 다른 내용 용없습니다. 질문의 핵심은 "CSS가 적용되지 않는다. 왜 그러냐?". 답변은 달지 않았지만, "잘 하면 적용 돼요" 정도가 답변이 됩니다.

 

2)

이북 뷰어에서는 잘 나오는 CSS가(에를 들면 박스나 이미지 첨부 같은) 웹으로 보면 CSS가 대부분 깨져서 나오는 곳이 있더라구요.

* 이것 도 다른 내용이 없습니다. 질문의 핵심은 "CSS가 뷰어 별로 다르게 보여요. 어떻게 해야돼요?". 이 글도 답은 달지 않았지만, "여러 뷰어에 잘 보이게 CSS를 만드세요"가 답이에요.

 

3)

한데 최근에 버전업(2.0.2)된 sigil에서는 Add-cover가 안 먹히네요. 책들도 찾아보고 이렇게저렇게 코드도 고쳐 보고, 심지어 설정에 들어가서 여기저기 폴더를 바꿔 가며 cover.xhml을 넣어 보기도 했는데 끝내 해결 못 했습니다. 왜 안 되는 걸까요?

* 이 질문의 답변은, Sigil 2.0.2에서 Add-cover가 잘 적용됩니다. 였습니다.

 

4)

미리보기 내용과 달리 리디움리더로 보면 사진파일이 모두 보이지 않고 폰트도 제가 지정한 폰트로 변환되어 보이지 않습니다. 무엇이 문제일까요?

* 이 질문의 답변은 "무언가 문제가 있을거예요." 입니다. 제대로 하면 잘 보여요.

 

5)

sigil에 적용된 폰트를 플랫폼 뷰어에서도 보이게 하고 싶어서 시도해보고 있는데, sigil 상에는 폰트가 잘 적용되어있는데 리디북스 등의 뷰어로 보면 안 나타나더라고요^^;

* Sigil에서 제대로 적용하면 플랫폼 뷰어에서도 제대로 보여요.가 답이에요.

 

6)

제작문의 : PDF로 준비되었으며 캘리버로 변환해보아도 잘 안됩니다.

* 이게 질문 내용 전부예요. 답변을 달지 않았습니다. 궂이 달자면, '원래 안돼요' 정도?

 

 

 

반응형
posted by 내.맘.대.로 2024. 11. 4. 09:36

내맘대로의 EPUBGUIDE.NET에서 편집자의 의도를 그대로 살려 전자책을 제작해 드립니다.

종이책의 편집 스타일을 최대한 유지하며, 팝업 주석 처리, 이미지 확대 축소 등 전자책의 장점을 반영하여 전자책을 제작합니다. 탬플릿을 사용하지 않고, 책 한권 한권 고유 스타일을 살리기 때문에 전자책에서도 종이책 디자인을 느낄 수 있습니다.

한국출판문화진흥원의 [텍스트형 전자책 제작 지원 사업] 선정 도서는 ‘제작 난이도별 제작비 산정 기준에 근거하여’ 제작 단가를 산정하고, 일정에 맞춰 제작을 해 드리니 많은 문의 바랍니다.

자세한 내용은 여기로: https://www.epubguide.net/notice/309

오래 전 작성된 글은 현재의 Sigil 버전과 차이가 날 수 있습니다. 등록 일자를 확인 하고 1년 이상 지난 글은 변경된 내용이 있는지 확인하시기 바랍니다.

조만간(아마도 1주 ~ 2주 정도?) 이내에 Sigil 2.4.0 버전 업데이트 예정입니다.

이번 업데이트에는 아주 유용한 기능이 포함됩니다.

New Features

- added a GetInfo dialog and right click menu option for XHTML files that provides a collection

of information specific to that file without having to run Reports (including a word count)

* [보고서]를 실행하지 않고, 책 찾아보기 창에서 선택한 xhtml 파일의 정보를 확인할 수 있습니다. 단어 수, 이미지, 비디오, 오디오 파일 사용 여부, 스타일시트/자바스크립트 연결 정보 등 다양한 정보를 바로 확인할 수 있습니다.

최종 배포 버전에서는 한국어 번역이 반영될 예정입니다.

- added support for multiple semantics per xhtml file, while uncommon is technically allowed by the spec

* xhtml 파일에 여러개의 의미론(Semantics) 정보를 추가할 수 있습니다. EPUB3를 편집할 때 유용합니다.

- made debugging with VS IDE easier

* VS IDE로 디버깅 하기 쉽게 만들었다고 합니다. 무슨 의미진지는 정확히 모르겠지만, VS를 함께 사용하는 분들께 도움이 될 것 같습니다.

- streamlined Sigil logos and installer for Windows

* 윈도우에서 Sigil 설치가 훨씬 간결해졌습니다.

- improve Sigil Well-Formed (sanity check) to better identify errors with missing attribute quotes

* Sigil 문법 검사(Sigil Well-Formed) 기능이 개선되었습니다.

- update to Qt 6.7.3 and its PySide6 version for MacOS and Windows release builds

* QT, PySide6 버전을 업데이트 했습니다.

- updates to building on linux documentation

* 리눅스 문서를 업데이트 했습니다.

반응형
posted by 내.맘.대.로 2024. 10. 30. 09:07

내맘대로의 EPUBGUIDE.NET에서 편집자의 의도를 그대로 살려 전자책을 제작해 드립니다.

종이책의 편집 스타일을 최대한 유지하며, 팝업 주석 처리, 이미지 확대 축소 등 전자책의 장점을 반영하여 전자책을 제작합니다. 탬플릿을 사용하지 않고, 책 한권 한권 고유 스타일을 살리기 때문에 전자책에서도 종이책 디자인을 느낄 수 있습니다.

한국출판문화진흥원의 [텍스트형 전자책 제작 지원 사업] 선정 도서는 ‘제작 난이도별 제작비 산정 기준에 근거하여’ 제작 단가를 산정하고, 일정에 맞춰 제작을 해 드리니 많은 문의 바랍니다.

자세한 내용은 여기로: https://www.epubguide.net/notice/309

오래 전 작성된 글은 현재의 Sigil 버전과 차이가 날 수 있습니다. 등록 일자를 확인 하고 1년 이상 지난 글은 변경된 내용이 있는지 확인하시기 바랍니다.

올해는 진흥원 전자책 실무자 강의 수강 신청을 너무 일찍 받았다 싶었는데 벌써 다음주네요.

다음주 부터 전자책 실무자 강의 indd to epub과 txt(HWP/DOC등) to epub 강의를 시작합니다.

책공장에 계신 분들 중에도 강의 신청한 분이 계실거예요.

강의 시작 전에,

"내가 뭘 알고 싶은지"

를 생각하고 오세요.

많은 분들이 그냥 설명하는 내용만 받아가는데 이런 분들은 제대로 배우기 어렵습니다.

그리고 이런 수업은 재미가 없어요.

강의를 듣는다면, 강사를 쥐어짜세요.

제 수업 뿐 아니라, 모든 수업에서,

여러분들이 전자책 만들며 고민하는 모든 문제의 해결 방법을 강사는 알고 있습니다.

"이런 건 방법이 없겠지."라고 스스로 한계를 두지 마세요.

수강생이 방법을 찾을 수 없는 것 까지 알고 있기 때문에 강의를 하는거예요.

수강생이 말도 안된다고 생각하는 내용이라도, 강사는 해결 방법을 알고 있어요.

진짜 불가능한 문제라면, 불가능하다는 것을 알려줍니다.

불가능 한 것과 가능한 것만 구분해도 고민이 줄어요.

강의 시간에 강사가 설명하는 것만 받아 적지 말고,

내가 알고 싶은 것을 강사한테 물어보세요. 그럼 강사는 해결 방법을 알려줍니다.

그리고 강사 괴롭히는 수강생을 강사들은 좋아해요.

강사에게 질문을 많이 하는 수업일 수록, 강사는 더 많은 것을 알려줍니다.

이런 질문 하면 강사가 당황하지 않을까 하는 고민 말고

강사를 당황시켜 봐야지 마음 먹고 어려운 질문 많이 하세요.

그럼 수업이 더 재미있어 질거예요. 그리고 더 많이 배울 수 있습니다.

반응형