Thanks to visit codestin.com
Credit goes to www.cnblogs.com

摘要: 续之前的贴子,我们有了部精修词典,二至六字词共169872个。 foreach 词,用字的2-gram去检查首选是否正确,结果很差,可在〔这里〕下载 123094个不一样的。部分结果: 䴔䴖 交警 𫘝𫘨 抉剔 吖嗪 阿嗪 腌菜 言采 腌肉 眼肉 折光度 遮光度 折斤斗 辄筋斗 折腰步 这么不 折 阅读全文
posted @ 2025-11-16 00:53 华容道专家 阅读(4) 评论(0) 推荐(0)
摘要: 原书好像有段话调侃说:困惑度最大的好处是开组会方便,因为可以说:“我们把perplexity降低了多少”。 看书一向不仔细的我更困惑了:语言模型就是一堆概率啊。 语料一般划分为训练集和测试集两个集合,每个都由若干句子组成,训练集一般比测试集大得多。 困惑度一般用测试集计算。 问AI “举例说明如何计 阅读全文
posted @ 2025-11-12 12:38 华容道专家 阅读(6) 评论(0) 推荐(0)
摘要: 〔最新进展,有系统词典和用户词典了…〕 全部文件的行数 720 gb2312.utf8 这些是数据 16463 hz-py.utf8 2894733 slm.arpa 文本文件格式的语言模型 15 h.h 这些是程序 125 ime.cpp 109 pinyin.cpp 44 seg.cpp 17 阅读全文
posted @ 2025-11-11 16:31 华容道专家 阅读(23) 评论(0) 推荐(0)
摘要: import sys import requests from bs4 import BeautifulSoup as BS def get_links (url): links = [] try: r = requests.get(url); r.raise_for_status() # 失败抛出 阅读全文
posted @ 2025-11-08 09:20 华容道专家 阅读(5) 评论(0) 推荐(0)
摘要: 翁学天 (Xuetian Weng, CSSlayer),写了scel2org (fcitx-tools的一部分)。 我把他的.c程序挪了出来,不用装别的,gcc scel2org.c即可编译: 〔这里〕可下载 scel2org.c utarray.h uthash.h utils.h 补充:uth 阅读全文
posted @ 2025-11-08 00:13 华容道专家 阅读(3) 评论(0) 推荐(0)
摘要: 中文有多少词?多少词够用? ① 到〔灵格斯词典〕下载了成语词典、成语小词典、地名、诗词和文化词典, 用〔kdictionary-lingoes〕提取了文本文件。总计29,560个词条(未去重)。 ② googlepinyin和sunpinyin都是约6万词。 ③〔Gitee-pypinyin〕可以标 阅读全文
posted @ 2025-11-04 20:34 华容道专家 阅读(19) 评论(0) 推荐(0)
摘要: 简介 合并优化了多部词典,pydict_sc.bin 12M 20万词 用sunpinyin的统计语言模型工具训练了字的三元语法模型。训练语料为wiki+百科问答 lm_sc.t3g 12M 12298 items in 1-level, 740231 items in 2-level, 35283 阅读全文
posted @ 2025-11-02 20:59 华容道专家 阅读(15) 评论(0) 推荐(0)
摘要: 《莲花井》,作者: 阿·卡赞采夫、马·西亚宁 〔阅读〕 此碑文系太阳神祭司所刻。这堵墙后有一口圆形莲花井,边上有一块石头、一把刻刀和两根细长棍子。这两根棍子一根长3个度量单位,另一根为2个度量单位。如果将棍子一端抵住井的底角斜靠在井里,两根棍子正好在水面交叉,水面距离井底为1个度量单位。谁能用这两根 阅读全文
posted @ 2025-10-29 15:37 华容道专家 阅读(11) 评论(0) 推荐(0)
摘要: 网上许多trie施肥很足,比如C++版参数是string而不是const string_view&, Python版不用dict class TrieNode: def __str__(this): return str((id(this) - id(root)) // 64) def __init 阅读全文
posted @ 2025-10-27 23:25 华容道专家 阅读(4) 评论(0) 推荐(0)
摘要: 如题。烂代码分别如下: <pre style='display:none'> <img id=tile1 src='data:image/gif;base64,R0lGODlhMgA9APcAAAAAAAAMAAwMDAEUAQAaABMTExsbGwArAAAmAAA8AAA1AB8gHyIiIi 阅读全文
posted @ 2025-10-27 19:36 华容道专家 阅读(9) 评论(0) 推荐(0)
摘要: apt source libsunpinyin3v5 下载到当前目录下。 src/sunpinyin-dictgen是个有shebang的Makefile: #!/usr/bin/make -f W3M = wget -q -O - DL_LIST = https://sourceforge.net 阅读全文
posted @ 2025-10-27 19:25 华容道专家 阅读(10) 评论(0) 推荐(0)
摘要: const char* NM[][4] = { {"曹","贼","真","爽"}, {"西","施"}, {"昭","君"}, {"貂","蝉"}, {"甄","姬"}, {"玉","环"}, {"美"}, {"美"}, {"美"}, {"美&qu 阅读全文
posted @ 2025-10-27 08:23 华容道专家 阅读(42) 评论(0) 推荐(0)
摘要: $ a.out test init=ok search=34/34 candidate_num=157 dec=34 py2=shijiwentiyaodaoshijicainengjiejue $ a.out read successfully, lemma num: 65101 spelling 阅读全文
posted @ 2025-10-24 19:57 华容道专家 阅读(3) 评论(0) 推荐(0)
摘要: 输入: [1.000 2.000 3.000]输出: [ 3.464 -1.414 0.000]重建: [1.000 2.000 3.000] [0] cos(0.0*π/3)*sqrt(1/N)*1.0 + cos(0.0*π/3)*sqrt(1/N)*2.0 + cos(0.0*π/3)*sqr 阅读全文
posted @ 2025-10-19 19:18 华容道专家 阅读(12) 评论(0) 推荐(0)
摘要: #include <stdio.h> #include <stdint.h> #include <stdlib.h> #include <mmintrin.h> #include <pthread.h> #include <algorithm> /* 0 Q......Q 3 ..Q..... 4 阅读全文
posted @ 2025-10-19 15:57 华容道专家 阅读(5) 评论(0) 推荐(0)
摘要: 小时候在《科学画报》上看到过,不会。长大后会编程了,能做到试3!×3!×4!×4!次了,又发现手工可解。 先看手工:用个5x5的表格表示状态,行依次是:国籍、房子颜色、饮料、香烟、宠物。表格初始空白。 “挪威人住第一间房,挪威人住蓝房子隔壁,住中间房子的喝牛奶”: “绿房子在白房子左面隔壁,住绿房子 阅读全文
posted @ 2025-10-18 13:55 华容道专家 阅读(24) 评论(0) 推荐(0)
摘要: 虽然三种方法得到的弦都能“覆盖”整个圆,但弦长的分布不同,见上图。 from math import pi import numpy as np from PIL import Image as Img, ImageDraw as ID import matplotlib.pyplot as plt 阅读全文
posted @ 2025-10-18 03:05 华容道专家 阅读(6) 评论(0) 推荐(0)
摘要: <html><head><meta charset="UTF-8"> <meta name="screen-orientation" content="landscape"> <meta name="viewport" content="width=device-width, initial-sca 阅读全文
posted @ 2025-10-17 22:29 华容道专家 阅读(7) 评论(0) 推荐(0)
摘要: 首先用Bing搜gold price,得到下图: 然后用Gwenview, IrfanView等裁剪图片,得到下图: 裁多了。应正好裁外框——可用opencv的演示程序squares.py :-) 然后用程序找出红线上各点坐标。如果提取红色通道,由于白是(255,255,255),红是(255,0, 阅读全文
posted @ 2025-10-16 13:42 华容道专家 阅读(15) 评论(0) 推荐(0)
摘要: 如把下图 转换成:3ak4/7R1/3aCcN2/p7p/6r2/9/Pr1p1n2P/4B1p2/9/2BAKA1R1 模型21K,Intel N100上训练时间0.969秒,识别时间0.957秒。识别率好像是100% 一、安装软件包 apt install python3-scipy pytho 阅读全文
posted @ 2025-10-11 12:51 华容道专家 阅读(12) 评论(0) 推荐(0)