php 提取数字-如何使用PHP脚本手动将纯文本文件转换为网页的解决方案

最近,我的一位老朋友打电话给我寻求帮助。 他担任记者多年,最近获得了重新发表许多早期专栏的权利。 他希望将他的作品发布到网络上; 但他的专栏被保存为纯文本文件,他既没有时间也没有兴趣学习 HTML 来将它们转换成网页。 由于我是他电话簿中唯一懂电脑的人,他打电话给我,看看我是否还能帮助他。

“让我来处理吧,”我说。 “一小时后给我打电话。” 当然,几个小时后他打电话来时,我已经为他准备好了解决方案。 这需要一点 PHP,我得到了他无尽的感谢和一盒酒。

那么这一小时我做了什么? 这就是本文的主题。 我将向您展示如何使用 PHP 快速、完美地将纯 ASCII 文本转换为可读的 HTML 标记。

首先让我们看一个我同学想要转换的纯文本文件的示例:

绿色火星!

约翰·R·多伊

来自火星的小绿人的想法长期以来一直是科幻小说的主要内容,但可能很快就会变得不再是幻想,而是更多的事实。

最新火星探测队最近发送的样本表明,大气中叶绿素含量很高。 您可能还记得,叶绿素使植物呈绿色。 因此,火星上的生物体很可能通过持续接触绿色物质,在其外骨骼上形成绿色色调。

对 ASDA 火星殖民项目负责人 Rushel Bunter 博士的采访等等等等……

这对你来说意味着什么? 嗯,意思是哈哈哈哈……

在线跟踪此故事的后续内容:

提取数字中间几位_php 提取数字_提取数字的快捷键

。 要查看最新样品的图片,请登录

非常标准的文本:它有一个标题、一个署名和几个文本段落。 将此文档转换为 HTML 真正需要做的是使用 HTML 的分支和段落标记来保留网页上原始文本的布局。 特殊标点符号需要转换为相应的 HTML 符号php 提取数字,超链接需要显得可点击。

下面的 PHP 代码(清单 A)将完成里面的所有任务:

列表A

// 设置源文件名和路径

$source = "toi200686.txt";

// 将原始文本读取为数组

$raw = file($source) 或 die("无法读取文件");

// 检索第一行和第二行(标题和作者)

$slug = array_shift($raw);

$byline = array_shift($raw);

提取数字的快捷键_php 提取数字_提取数字中间几位

// 将剩余数据连接到字符串中

$data = join('', $raw);

// 用 HTML 实体替换特殊字符

// 将换行符替换为

$html = nl2br(htmlspecialchars($data));

// 将多个空格替换为单个空格

$html = preg_replace('/ss /', ' ', $html);

// 用元素替换 URL

$html = preg_replace('/s(w ://)(S )/', ' 12', $html);

// 开始构建输出页面

// 添加页眉

提取数字的快捷键_php 提取数字_提取数字中间几位

$输出=标题

html>

头>

风格>

.slug {字体大小:15pt; 字体粗细:粗体}

.byline { 字体样式:斜体 }

/风格>

/头>

正文>

标头;

// 添加页面内容

提取数字中间几位_php 提取数字_提取数字的快捷键

$输出.=“$slug”;

$output .= "通过 $byline";

$输出.=“$html”;

// 添加页脚

$输出.=页脚

/正文>

/html>

页脚;

// 在浏览器中显示

回显$输出;

// 与/或

// 将输出写入新的 .html 文件

file_put_contents(basename($source, substr($source, strpos($source, '.'))) . ".html", $output) 或 die("无法写入文件");

让我们看看它是如何工作的:

第一步是将纯 ASCII 文件读入 PHP 字段。 使用 file() 函数可以轻松完成此操作,该函数将文件的每一行转换为数字索引字段的元素。

然后,使用 array_shift() 函数从链接列表中提取标题和作者行(我假设它们是文件的前两行)并将其放入单独的变量中。 然后将数组的其余成员连接成一个字符串。 该字符串现在包含每篇文章的文本。

文章正文中的“'”、“”等特殊符号通过 htmlspecialchars() 函数转换为相应的 HTML 符号。 为了保留文章的原始格式,使用 nl2br() 函数将换行符和段落转换为 HTML 元素。 通过简单的字符串替换,将文章中间的多个空格压缩为一个空格。

文章正文中的URL是使用正则表达式测量的,两边都有元素。 当页面显示在 Web 浏览器中时,它会将 URL 转换为可单击的超链接。

然后使用标准 HTML 规则创建输出 HTML 页面。 文章的标题、作者和正文均使用 CSS 样式规则进行样式设置。 尽管此脚本不执行此操作php 提取数字,但您可以在此处自定义最终页面的外观。 您可以向模板添加图形元素、颜色或其他华丽的内容。

创建 HTML 页面后,可以使用 file_put_contents() 将其发送到浏览器或保存为静态文件。 请注意,保存后,原始文件名将被分解,并为新创建的网页创建一个新文件名(称为 filename.html)。 然后,您可以将网页发布到 Web 服务器、将其保存到 CD 或进一步编辑。

注意:使用该脚本创建HTML文件并将其保存到C盘时,必须确保该脚本对文件保存目录具有写权限。

正如您所看到的,如果您有标准格式的 ASCII 纯文本数据文件,则可以使用 PHP 相当快速地将其转换为可用的网页。 如果您已经有一个网站并计划向其中添加新的网页,那么调整页面生成器使用的模板以使其适应原始网站的外观是相当容易的。 自己尝试一下吧!