
<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>首页 on Networkcat&#39;s Blog</title>
    <link>https://nc.gy/</link>
    <description>Recent content in 首页 on Networkcat&#39;s Blog</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sat, 23 May 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://nc.gy/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>只索引10个网站的搜索引擎</title>
      <link>https://nc.gy/posts/search-engine-for-10-sites/</link>
      <pubDate>Sat, 23 May 2026 00:00:00 +0000</pubDate>
      <guid>https://nc.gy/posts/search-engine-for-10-sites/</guid>
      <description>&lt;p&gt;要解答技术问题，一个搜索引擎只需要收录以下这10个网站。Reddit、Stack Overflow、Stack Exchange、Hacker News、GitHub、Wikipedia、YouTube 中文社区：V2EX、NodeSeek、Hostloc 以上至少是对我来说能解决大部分技术问题的网站列表。当然，如果把列表扩充一下，可以加上各种官方文档。&lt;/p&gt;&#xA;&lt;p&gt;在Google搜索技术问题，Reddit、Stack Exchange、Hacker News这三个网站是排名最高的，而且最有可能解决你的问题，很多人也会直接site:进行站内搜索。这些网站都有自己的站内搜索，用Google纯粹是因为它们的站内搜索做得太垃圾了。仔细想一想，Google一个能在毫秒内搜索整个互联网的强大搜索引擎，现在很多人把它作为Reddit的站内搜索引擎，曾经不是这样的，是互联网质量下降了，还是Google不行了？&lt;/p&gt;&#xA;&lt;p&gt;网页内容的下降很大程度是Google促成的，Google掌控广告和搜索，站长为了更高的排名把网站进行过度SEO，可以参考各个英文食谱网站，不仅过度SEO，还有很多广告、弹窗，这些广告毫无例外都是AdSense。Reddit这样的UGC平台由于内容发布的便利性，本身就导致自建网站发布内容的人更少。为数不多还在老实写文章不做SEO的站长也因为流量不如以前转向各大平台，最终就导致了几乎所有高质量内容都在Reddit、Stack Exchange上。这是个恶性循环，现在的AI Overview只会加剧这种情况，访客更没理由去查看个人博客的内容，因为都被AI给总结了。但访客还是会访问Reddit等社区，因为这些社区有用户之间真实的讨论，但博客无法提供这种内容。&lt;/p&gt;&#xA;&lt;p&gt;很多人说SEO已死，在我看来SEO本身就不应存在，它只是在搜索算法不够聪明时过渡的一个产物。如果搜索算法足够聪明，与其给我一个链接列表，不如根据我的搜索查询、浏览习惯直接重定向到那个最能解决问题的网页，不需要LLM，而是直接重定向到全互联网上最能解决我问题的网页。当然，这种搜索体验尚不存在，现在只有LLM问答式的搜索，LLM在询问较详细具体的问题时有用，但未来AI的成本还是会很高，如果无法做到和当前一个传统Google搜索相似的成本，就没办法通过广告挣钱，也不可能长期免费免登录提供给用户，这也是为什么Google搜索现在还活着的原因。&lt;/p&gt;&#xA;&lt;p&gt;Google搜索没有死，以后很长时间都会存在，即使作为一个大型站内搜索引擎也是很好用的。但如果你要做一个&amp;quot;程序员搜索引擎&amp;quot;或现实一点，训练一个大模型，你只需要在下载这些网站的Common Crawl数据集即可覆盖绝大部分技术问答场景，因为网上大部分的高质量内容都聚集在这几个网站内。&lt;/p&gt;</description>
    </item>
    <item>
      <title>为何比如何更重要</title>
      <link>https://nc.gy/posts/why-is-more-important-than-how/</link>
      <pubDate>Mon, 13 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://nc.gy/posts/why-is-more-important-than-how/</guid>
      <description>&lt;p&gt;知道为何做一件事比知道如何做更重要。我一直想为这个主题写一篇博文，最近我在V站也看到了同样观点的评论，还是有人同感的。&lt;/p&gt;&#xA;&lt;p&gt;AI让效率提高了，自然也就想去做更多的东西了。以前一些很蠢的idea，我可能在实践之前就会放弃，因为idea看起来不够promising。现在有了claude，因为效率很高，我去实现一些看起来很蠢的idea的概率就更高。不过，即使我做了一些side project，然后我觉得它不够好的话，我是不会去公开它的。我想很多人和我一样，但是同样也有很多人选择公开很trash的项目。&lt;/p&gt;&#xA;&lt;p&gt;一些你能经常在V站看到的trash类型包括：工具站、信息聚合、游戏站、AI写的APP/插件。这些东西无一例外都是AI写的，作为一名有节操的工具站长(ip.nc.gy 拥有市面上唯一开源的IP风控数据库)，我认为做工具站没有问题，但是你做的工具一定是在市面上没有的，并且有足够大的痛点，同样的东西在你发布之前一年内不会有别人做出类似的出来，并且要有这辈子都不赚广告钱的决心。这样才值得做，任何产品都是这个逻辑。在做一个项目之前一定要想为什么做，这样就不会浪费自己和他人的时间。&lt;/p&gt;&#xA;&lt;p&gt;AI同质化问题不仅是项目，很多人的博客也同质化严重。不过不能怪AI，十年前中文技术博客就普遍那样了，闭着眼睛就能想出来一个average简中技术博客的文章风格。一定是大量的教程文章，或者是解释某个技术概念的文章。这样的文章写得好的话没有问题，能帮到人就好。但现在大家都在问AI的情况下，教别人怎么做的文章价值就不高了。&lt;/p&gt;&#xA;&lt;p&gt;很多人说和英文互联网对比中文博客圈不好，那是因为在中文博客圈发展起来之前，有观点和创作能力的人都被公众号、知乎吸引走了。最后留下的只剩靠搜索引擎流量的技术博客和有精神洁癖的碎碎念心情博客。这样的博客很好，没有任何问题，但我不觉得是大家想在RSS看到或论坛分享的。&lt;/p&gt;&#xA;&lt;p&gt;什么博客在现在的互联网是有意思的？我认为就是你在HN首页会看到的个人博客，它们一定会是观点文章，或是发现了某个独特的现象。在以前很多人讨厌有明显个人观点的文章，把观点称为私货，但是现在的AI只会输出干货，干巴巴的，大家的看法发生了扭转，反而想要更有人味的内容。只要观点够好，私货就是干货，可参考PG的文章，全是私货，但是很有价值。&lt;/p&gt;&#xA;&lt;p&gt;本博客也不会写任何教程类的文章，这样的文章太好写也太常见了。我只会在这里写技术相关（或不相关）的随笔，存在大量私货，欢迎订阅。&lt;/p&gt;</description>
    </item>
    <item>
      <title>AI服务的交叉补贴</title>
      <link>https://nc.gy/posts/ai-cross-subsidization/</link>
      <pubDate>Fri, 03 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://nc.gy/posts/ai-cross-subsidization/</guid>
      <description>&lt;p&gt;25天前写了篇关于&lt;a href=&#34;https://nc.gy/posts/cross-subsidization/&#34; target=&#34;_blank&#34; rel=&#34;noopener noreferrer&#34;&gt;交叉补贴&lt;/a&gt;的文章，这篇文章讲了我对这个概念的理解，但是没有更深度讲AI的交叉补贴，我觉得这实际上是最应该讲的，因为我已经看到AI服务依靠交叉补贴的不可持续性了。&lt;/p&gt;&#xA;&lt;p&gt;关于交叉补贴，在互联网行业的话一般指的就是厂商依靠占多数的轻度用户挣钱，用轻度用户挣的钱去补贴占少数的重度用户。举例，比如一个月只看2部影片的用户和一个月看200部影片的用户，付的订阅价格是一样的，但是Netflix从重度用户那里挣的钱肯定是更少的，但是由于有很多轻度用户一个月不会看多少影片，Netflix也就能容忍这些重度用户了。&lt;/p&gt;&#xA;&lt;p&gt;对于Netflix、Apple Music这些传统的Web应用，实际上不需要高度依靠交叉补贴，因为对等互联让带宽的成本非常低。但是对于现在的AI应用来说，模型推理的成本就很高了，如果让他们的重度用户用的爽，就需要很多轻度用户来支撑，否则只会让已经亏损的AI公司亏更多钱。&lt;/p&gt;&#xA;&lt;p&gt;很长一段时间，这种模式是可行的，有足够多的轻度用户加入，每个月支付20美金仅进行简单的问答，模型厂是躺赚的状态。但现在，在我看来就只有程序员对AI是刚需，其余人的工作和生活实际上AI帮不了多少忙，工作上用AI去写任何文字都或多或少有AI味，要人工修改，不如干脆人工编写。生活上，绝大多数问题用Google搜索Reddit即可。现在网上，普通人对AI应该都是这种态度，那每个月支付20美金给AI服务就没有必要了，况且完全可以用Google、OpenAI等提供的免费额度。&lt;/p&gt;&#xA;&lt;p&gt;如果现在AI最实用的地方是写代码，而写代码非常烧Token，大部分用户又都是写代码的重度用户，那靠轻度用户补贴重度用户的模式就行不通了。自从写完上篇文章又涨了很多新知识，有人说200美金的Claude订阅能烧出5000美金的Token，是否属实我没有进行验证，但是Claude Code肯定能烧出&amp;gt;200美金的Token的，那这多出去的Token开销就是依靠交叉补贴。我最近还了解了中国的中转站，这些中转站就是看中了这个羊毛，注册大量的Max plan账号，然后把账号转换成API，给一堆用户去用。&lt;/p&gt;&#xA;&lt;p&gt;只要Claude 200美金的订阅能用出&amp;gt;200的Token就无法避免被滥用，Anthropic现在面临双重压力，一边是重度用户越来越多轻度用户越来越少，一边是中转站大规模的滥用。Anthropic是否还能坚持交叉补贴？这里做个轻松的预言，很快各大模型厂会收紧限额，降低交叉补贴的力度。我认为未来烧钱抢用户的时代过去后一定会变成200美金订阅只能用出200美金的Token，相当于就是按量付费。这肯定是大家不想看到的结局，我是用过一段时间API按量付费编码的，一个大型代码库，几天就烧了2K美金，如果是公司报销还好但对于个人用户来说如果转为按量付费就是Game Over了。&lt;/p&gt;&#xA;&lt;p&gt;为什么这里只说Anthropic？因为Anthropic的客户群全是用它们模型编程的，因为Claude系模型编程最好。轻度休闲用户都在OpenAI那呢，Anthropic的客户群全是重度用户，这就很糟糕了。而且Anthropic和OpenAI不一样，A\的基础设施投资比较保守，所以现在发现GPU不够用了，不仅要训练新模型还要满足大量推理请求。A\的风控也是不如OpenAI的，在之前大家都在用ChatGPT的时候经常听到有人抱怨GPT降智和在网页搞POW，现在没听过A\搞降智。&lt;/p&gt;</description>
    </item>
    <item>
      <title>数据时代</title>
      <link>https://nc.gy/posts/the-data-age/</link>
      <pubDate>Tue, 10 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://nc.gy/posts/the-data-age/</guid>
      <description>&lt;p&gt;什么SaaS不会被Vibe code出来的软件替代？比如Salesforce、Slack在未来十年还会继续存在，而且会不断的增长。以Slack为例，它大部分的复杂度在于如何让Slack在极高流量下运行，如果要自己做一个in house clone，不需要考虑扩展性，实际上是很容易的。之所以没人这么做是因为大量的历史消息无法迁移。Slack对比MS teams、Discord最大优势是它起步早，有大量团队在使用它，聊天记录很难迁移到其他平台。Salesforce也是同理，存在大量的历史数据。如果一个B2B SaaS有大量的用户数据，那这个服务就不可能被AI写的软件替代。&lt;/p&gt;&#xA;&lt;p&gt;Maxmind、IPinfo都是专注于数据的SaaS，它们的护城河不是用户数据，而是自己依靠算法聚合的数据。做一个IP地理库，需要上千个探测节点，根据延迟来推算出位置，是非常大的基础设施投资。市面上有很多卖IP API的小SaaS，实际上就是在转卖Maxmind的免费数据库，这样的SaaS已经在被AI消灭，但像Maxmind、IPinfo这样的数据源头在未来还会继续存在。另外类似的SaaS有Shodan和Censys，都是专注于网络情报的，扫描整个互联网不仅需要基础设施，还需要强大的法务部。&lt;/p&gt;&#xA;&lt;p&gt;以上举的例子全都是B2B的服务。GitHub、Hugging Face这样的服务既面向消费者也面向企业，不仅有大量的用户数据，而且还有强大的网络效应。即使有竞争对手把整个GitHub都爬了，首先这样做肯定是违反TOS的，就算这样获取了用户数据，你还是无法挑战GitHub的网络效应。最近有传言OpenAI要自己搞个GitHub Clone，结局肯定不会太好，可参考Gitee。&lt;/p&gt;&#xA;&lt;p&gt;未来如果做B2B SaaS，做像Slack、Notion这样存放大量用户数据的服务，并且让迁移很困难。做B2C的服务，要像GitHub一样有社区，有网络效应后就很难被替代。&lt;/p&gt;</description>
    </item>
    <item>
      <title>交叉补贴</title>
      <link>https://nc.gy/posts/cross-subsidization/</link>
      <pubDate>Mon, 09 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://nc.gy/posts/cross-subsidization/</guid>
      <description>&lt;p&gt;Itunes的买断制或Apple Music的订阅制。后者看似更划算，花十块钱就能听Apple音乐库中的一亿首歌。但如果经常只听特定几个歌手的几张专辑，实际用itunes买断更划算。像这样的轻度用户，经常重复听的歌全部在设备本地缓存，不占用Apple的带宽成本，每月10块钱Apple几乎是白赚。但有些人（或Bot)每月听上千首歌，这些人很少，但占用了大部分的带宽成本，这些重度用户同样也是付每月10元的订阅。这样的话Apple从重度用户身上赚不了多少钱，但Apple是从轻度用户身上赚钱的，而且轻度用户占多数，于是就形成了多数补贴少数的情况，多数人支付少数人产生的成本。这是互联网中交叉补贴（Cross subsidization）的一个例子。[0]&lt;/p&gt;&#xA;&lt;p&gt;带宽不贵，Apple有自己的数据中心，并在许多运营商机房里有边缘节点，即使一名用户一天听几千首歌，也不会产生特别高的成本。现在AI推理的成本就更高了，交叉补贴的另一个例子就是Claude的订阅。Claude既提供API按量付费也提供订阅套餐，多数人使用Claude的方式是订阅制。一名轻度用户，每月支付$20的订阅，进行的只是基本的网页问答，不需要深度思考，一个月肯定是不会用满20美元的token开销。但对于使用Claude Code的重度用户来说，每个月都把100刀的订阅用满，Anthropic实际上是没有挣多少钱的，甚至亏钱。因为有足够多的轻度用户在支付20美金的订阅，这些相对较少的重度用户产生的成本就能被覆盖掉。&lt;/p&gt;&#xA;&lt;p&gt;AI公司高度依赖交叉补贴的商业模式，因为AI的成本实在是太高了，需要有足够多的轻度用户来挣钱。所以，AI公司砸钱拍超级碗广告，同时注重提升使用模型时的用户体验，比如使用Claude的官方客户端比任何开源客户端的体验要好太多了。用户选择订阅制而非按量付费只是因为体验更好。在Itunes听一首歌需要先购买，增加阻力，用户体验差。在OpenRouter用API时总要盯着自己用了多少，总要手动充值。无论是使用以前的Itunes还是使用现在的OpenRouter都是要经常看见价格的，而用户看见价格就会犹豫要不要继续付款。&lt;/p&gt;&#xA;&lt;p&gt;主要就是程序员在高强度使用AI，非技术人群找不到什么使用AI的理由，AI可能只擅长写后端代码，任何AI写的文章、生产的图片都能看出AI味，而且在信息搜索这块多数人还是选择用Google。如果AI公司无法让足够多的轻量用户使用AI，而绝大多数用户都是重量级用户，就没有办法维持靠交叉补贴持续的商业模式了。&lt;/p&gt;&#xA;&lt;p&gt;Google Search和YouTube是靠广告维持的免费模式，Google的产品虽有订阅选项，但多数的收入来自于广告。IPhone出现之前，所有人都在用桌面浏览器上网，而桌面浏览器有个特性，你可以随意修改网站发送给你的HTML，于是很早就有了广告拦截器。随着互联网的发展广告屏蔽率越来越高，甚至已经对Google的商业模式产生了威胁。但在Google发力之前，IPhone发布了，然后有了App Store和Apps。APP有个特点，你没办法修改它的源代码，或者说门槛非常非常高，所以一般的手机用户没办法去广告，而这些手机用户占大多数的互联网用户。所以，逐渐的，Google不用担心自己的广告收入遭到威胁，对桌面端的广告屏蔽也没有那么打压了。[1] 就算是现在，你使用Firefox+ublock origin一样可以享受无广告的YouTube。这是广告商业模式下的交叉补贴，手机用户的广告收入支付桌面用户产生的成本。&lt;/p&gt;&#xA;&lt;p&gt;像Cloudflare这种bottom up的SaaS则是完全相反，让付费用户去补贴免费用户产生的成本，因为如果一名程序员的个人网站使用Cloudflare的免费计划那他就更有可能把Cloudflare带到工作 [2] ，而Cloudflare Enterprise的价格是很夸张的。&lt;/p&gt;&#xA;&lt;p&gt;[0] 音乐软件每次播放都要给版权方一点费用，所以实际上Apple Music主要开销不是带宽，不过文章为了方便解释就这么写了。&lt;/p&gt;&#xA;&lt;p&gt;[1] 虽然Google的YouTube在反制广告拦截器，但根据我的体验，Chrome+Adguard完全可以去广告。而且，FireFox永远是个选项。&lt;/p&gt;&#xA;&lt;p&gt;[2] &lt;a href=&#34;https://webmasters.stackexchange.com/questions/88659/how-can-cloudflare-offer-a-free-cdn-with-unlimited-bandwidth&#34; target=&#34;_blank&#34; rel=&#34;noopener noreferrer&#34;&gt;How can CloudFlare offer a free CDN with unlimited bandwidth?&lt;/a&gt;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
